Data Science для бізнесу. Як збирати, аналізувати і використовувати дані

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
«Data Science для бізнесу. Як збирати, аналізувати і використовувати дані»
Обкладинка видання українськю мовою видавництва "Наш Формат"
Автор Фостер Провост
Назва мовою оригіналу Data Science for Business: What You Need to Know about Data Mining and Data-Analytic by Thinking Foster Provost, Tom Fawcett
Країна США США
Мова англійська
Укр. видавництво Україна Наш Формат
Видавництво «O'Reilly Media»
Видано 19 серпня 2013
Видано українською 2019
Перекладач(і) Анастасія Дудченко
ISBN США ISBN 978-144-9361-32-7

Data Science для бізнесу. Як збирати, аналізувати і використовувати дані (англ. Data Science for Business: What You Need to Know about Data Mining and Data-Analytic) — книга американських науковців Фостера Провоста (професора інформаційних систем Школи бізнесу Леонарда Н. Штерна при Нью-Йоркському університеті, доктора філософії в галузі комп'ютерних наук в Університеті Пітсбурга) і Тома Фоусета (доктора наук в області машинного навчання). Вперше опублікована 19 серпня 2013 року американською видавничою компанією «O'Reilly Media»[1]. Українською мовою книга перекладена та опублікована в 2019 році видавництвом «Наш Формат» (перекладач — Анастасія Дудченко).

Огляд книги[ред. | ред. код]

Що таке «Data Science»? З якими проблемами може зіткнутися компанія, наймаючи на роботу фахівця з обробки даних? Автори книги не просто дають відповіді на ці та багато інших питань, вони виводять фундаментальні рішення, які мають відношення не до конкретного методу чи алгоритму аналізу даних, а й до погляду на проблему в цілому, до застосування такого аналізу в реальному світі.[2]

Основний зміст[ред. | ред. код]

Основа книги — досвід викладання дисципліни в Школі Леонарда Н. Штерна.

У першому розділі викладені основи Data Science, розповідається, що таке дата-аналітичне мислення, наводиться цікавий приклад прогнозу відтоку користувачів, а також розкривається роль Data Science в прийнятті рішень в компанії. Водночас згадуються великі дані в контексті Data Science, перехід від Big Data 1.0 до Big Data 2.0.

Другу частину присвячено бізнес проблем та їх вирішенню за допомогою Data Science. Автори пропонують кілька базових методик: класифікація та оцінка ймовірності, регресія, пошук подоб, кластерний аналіз, пошук асоціацій, профілювання, прогноз зв'язків, перетворення даних, казуальне моделювання. А також методи з учителем (supervised) та без вчителя (unsupervised).

Розділ третій присвячено введенню в предикативне моделювання: від кореляції до контрольованої сегментації (supervised segmentation). Наводиться приклад розгляду проблеми відтоку користувачів через індукцію дерев.

Інші важливі питання, детально розглянуті Фоусетом і Провостом:

підбір моделі до даних;

перенавчання моделі, методи уникнення цього процесу;

подібності, сусіди, кластери;

особливості хорошої моделі;

візуалізація моделі продуктивності;

очевидність та ймовірність;

аналітична інженерія;

інші Data Science завдання й техніки.

Крім того, розглядаються питання Data Science і стратегії бізнесу, фундаментальні концепції Data Science. Автори обговорюють майбутнє покоління дослідників даних, які навички будуть затребувані та які функції вони виконуватимуть.[3][4]

Відгук[ред. | ред. код]

«Книга „Data Science for Business“ — прекрасна відправна точка для подальшого вивчення кількісної аналітики. Дає бізнесменам набір важливих концепцій для розуміння аналізу даних, вчить ставити правильні питання. Прочитавши книгу, керівники підприємств зможуть адекватно оцінити висновки кількісних аналітиків, на основі чого — прийняти зважені рішення. Технічним фахівцям книга дає глибоке розуміння базових принципів, що лежать в основі аналізу даних та закладає основу для подальшого вивчення предмета», — DataReview.info, інформаційно-освітній портал[3]

Переклад українською[ред. | ред. код]

Примітки[ред. | ред. код]

  1. O'Reilly Media - Technology and Business Training. www.oreilly.com (англ.). Архів оригіналу за 10 квітня 2018. Процитовано 14 квітня 2019.
  2. Data Science for Business. www.goodreads.com. Процитовано 14 квітня 2019.
  3. а б Дворцын, Евгений. Обзор книги Data Science for Business. DataReview.info (ru-RU) . Архів оригіналу за 14 квітня 2019. Процитовано 14 квітня 2019.
  4. Обзор книги Data Science for Business | Data Science (ru-RU) . Архів оригіналу за 14 квітня 2019. Процитовано 14 квітня 2019.