Эта книга – практическое руководство по работе с данными в Python, написанное для тех, кто хочет не просто «знать теорию», а реально работать с данными в повседневных задачах. Шаг за шагом мы пройдем полный жизненный цикл данных: от хранения в базах и написания запросов до анализа, оптимизации и осмысленной интерпретации результатов.
Главный акцент сделан на практике, здесь нет перегруженной теории и абстрактных рассуждений – только то, что действительно нужно в реальности. Почти все примеры можно сразу копировать, запускать и видеть результат, благодаря чему обучение становится наглядным и максимально прикладным уже с первых глав, а практические проекты и кейсы из реального опыта покажут, как отдельные инструменты складываются в полноценные аналитические пайплайны и как принимать инженерные решения в условиях больших таблиц, ограниченных ресурсов и бизнес-задач.
Особое внимание уделено работе с большими данными, ИИ, машинному обучению: научимся создавать эффективные аналитические ИИ-модели, оптимизировать большие объёмы данных, разберем приёмы, которые редко встречаются во вводных курсах (обработка данных порциями, стриминговые выборки, снижение потребления памяти, ускорение pandas-кода, использование эффективных форматов хранения и т.д.).
При этом книга не требует глубоких знаний или предварительного опыта (все темы вводятся постепенно, простым языком, с упором на практику) и будет полезна широкой аудитории:
— новичкам, которые хотят понять, как устроена аналитика данных;
— разработчикам, которым нужно лучше понимать SQL и хранение данных;
— аналитикам, желающим укрепить фундамент;
— студентам, изучающим базы данных, Python, статистику;
— всем, кто хочет мыслить не только «кодом», но и данными.