Киоски данных


Недостатки создания хранилищ данных становились все более очевидны, и из этого родилась новая идея: киоски данных. Как Tesco развилась и стала сетью городских супермаркетов, унаследовав успех расположенных в центральных районах городов магазинов самообслуживания, так и некоторые компании обнаружили, что путь к успешному сбору данных о клиентах часто начинается с малого количества информации.
Разработчики киосков данных прагматично подошли к данным, времени и ресурсам и нашли компромисс: они создали меньшего объема активные базы данных, пожертвовав некоторыми деталями, отказавшись от «ненужных» данных, или же создавали миниатюрные хранилища данных, чтобы решить подмножество задач, например, исследуя лишь один покупательский сегмент. Киоски данных могли разрастаться, становиться больше со временем, или оставаться такими же. Они не были совершенными, но таким образом снижались стоимость и риск, и киоски данных работали.
Этот прагматичный подход использовали первые аналитики, работавшие с данными «Клубной карты». Они оценили технические возможности Tesco, определили самые срочные задачи для бизнеса и с учетом всего этого создали базу данных. Это не было идеально, но реально работало.
В основе решений лежали операционные системы оперативной обработки транзакций (системы OLTP), работавшие с кассовой системой супермаркетов. Системы OLTP созданы для обработки необходимого минимума информации с максимальной скоростью, в то время как хранилища данных предназначены для сбора больших объемов данных и их хранения во время анализа. Группа, работавшая над проектом, решила пойти на компромисс. Попытка получить гораздо больший объем информации с кассовых терминалов подразумевала радикальную модернизацию систем OLTP, благодаря которой кассы Tesco
функционировали, а для сотрудников отдела информационных технологий это был бы самый крупный проект, какой только возможен. Разумеется, встал и вопрос о возможном прекращении торговой деятельности.
Собрать только «сокращенные» данные означало бы пожертвовать деталями картины и точностью сделанных выводов, то есть о чем-то можно было только догадываться, а что-то пришлось бы просто игнорировать. Таков был необходимый компромисс.
Сокращение базы данных до нужного размера
Команда «Клубной карты» решила осуществить менее амбициозный проект по превращению данных в информацию о клиентах. Если Dunnhumby могла начать серию экспериментов для изучения поведения покупателей, и если она могла получить результаты этих экспериментов для определенных покупательских сегментов, то можно было узнать важную информацию о том, как клиенты делали покупки.

В действительности было решено не использовать данные для ответа на любой вопрос о любом покупателе, а только для получения ответов на самые глобальные вопросы, касающиеся большинства покупателей; Харрисон настаивал, чтобы каждый анализ был сосредоточен на продажах. «Как нам следовало предоставлять данные, чтобы ответить на конкретный деловой вопрос? Просто «интересные» данные не решали вопросов. Решением было увеличение продаж с помощью новых видов деятельности».
Если полученные результаты использовались для совершенствования новых видов деятельности и также анализировались, возникал механизм постоянных улучшений. Данные не говорили, что нужно делать дальше, они помогали понять, сработает ли то, чем вы занимаетесь.
В супермаркете нужно определить несколько категорий: цены, ассортимент товаров, рекламные акции и предложения, а также его размер. Перечень сравнительно ограниченный, аналитикам нужно было просто получить необходимые данные, чтобы проверить ряд гипотез. В 1995 году это означало записать идентификационный номер клиента, общую стоимость корзины, время совершения покупки, а также суммы, потраченные в каждом отделе магазина. Это всё, что умели делать кассовые системы Tesco в то время.
Dunnhumby также практично подошла к времени совершения покупки: фирма не могла справиться с данными, поступающими ежедневно, и столь часто собирать данные не требовалось. Достаточно было делать это раз в неделю. Но и в этом случае объем поступающей информации был все еще слишком
велик, чтобы его можно было быстро проанализировать. Данные поступали из супермаркетов, и общая стоимость всех покупок, сделанных во всех отделах всех магазинов, представленная в фунтах стерлингов и пенсах, выражалась пятизначным числом. Если умножить это количество на миллионы корзин, то еженедельно поступит гораздо больше данных.
Dunnhumby придумала статистический трюк, чтобы сократить объем данных примерно на 75%. Она создала программное обеспечение, в котором покупки в каждом отделе были представлены в виде двузначного числа от 01 до 99 - приблизительный процент от общей суммы покупательской корзины. Представьте себе Мamp;М в виде шахматной доски, у которой 64 клетки. Если вы хотите взять одну четверть шоколадки, вам нужно отломать 16 клеток. Метод определения не идеальный, но достаточно точный.
Таким образом, даже покупка в отделе не определялась с точностью до пенни. Настаивать на записи точной суммы было незачем: суммарная погрешность, даже при учете миллионов корзин, была незначительной и не мешала аналитикам достоверно учесть покупки, сделанные в каждом отделе.
<< | >>
Источник: Хамби Клайв, Хант Терри, Филлипс Тим. Набирая очки. Как розничная сеть супермаркетов Tesco выиграла битву за лояльного покупателя. 2006

Еще по теме Киоски данных:

  1. 3. Защита прав на программы для ЭВМ и базы данных Регистрация программ для ЭВМ и баз данных
  2. Хранение и использование персональных данных работников. Передача персональных данных работников
  3. Понятие персональных данных работника. Обработка персональных данных работника
  4. Структуры данных
  5. Структуры данных
  6. Структуры данных
  7. Структуры данных журнала
  8. Избыток данных
  9. Категория данных содержимого
  10. Структуры данных
  11. Чему научилась Tesco, работая с базами данных
  12. Организация данных
  13. § 5. Право изготовителя базы данных