Перейти к содержанию
Модуль 1: База: с нуля до уверенного пользователя веб-нейросетейУрок 6 из 22

Прогресс курса: 6 из 158 уроков · вся программа

Учебник по AI

ChatGPT анализирует продажи из Excel и строит графики

У ваших менеджеров уходит полдня на сбор статистики из Excel, а отчёты всё равно вручную. Разбираем, как с помощью ChatGPT загрузить CSV или Excel, построить графики, отфильтровать данные и выгрузить результат - без знания Python и за 2-8 часов. Подходит для стройфирм, турагентств, ecom-магазинов и любого малого бизнеса.

· 13 мин чтения
ChatGPT анализирует продажи из Excel и строит графики
Содержание статьи

У ваших менеджеров уходит по 4 часа на сбор заявок из Excel - половина данных теряется, а отчёты всё равно рисуют вручную. Вот как закрыть эту дыру за вечер без программиста.

до про - ChatGPT

Что такое Advanced Data Analysis и как его включить

Advanced Data Analysis - это функция ChatGPT, которая позволяет загружать файлы Excel и CSV, обрабатывать их и строить графики прямо в чате. Вам не нужно ставить Python, pandas или matplotlib - всё работает на стороне OpenAI.

Чтобы включить, убедитесь, что у вас платная подписка (ChatGPT Plus, Pro или Team). В настройках найдите опцию «Advanced Data Analysis» (или «Code Interpreter») и активируйте её. После этого в окне чата появится кнопка загрузки файла - как в мессенджере.

Разберём на примере стройфирмы (пример, не реальный кейс автора). У вас есть прайс на работы и типовой договор подряда. Вы хотите быстро понять, какие позиции приносят наибольшую выручку, и увидеть динамику по месяцам. ChatGPT сделает это за 5 минут.

Загрузка CSV и Excel: форматы, ограничения, кодировки

ChatGPT (модели GPT-4 и GPT-4o) поддерживает загрузку файлов напрямую. Для анализа используйте форматы CSV и Excel (.xlsx). Файлы .xls (старый формат Excel 97-2003) не поддерживаются - их нужно конвертировать в .xlsx или CSV перед загрузкой.

CSV: главный формат для анализа

CSV - самый надёжный вариант. ChatGPT читает его построчно без лишних преобразований. Ограничения: максимальный размер файла - 512 МБ для платных подписчиков. Для бесплатного аккаунта лимит около 25 МБ. Если файл больше, разбейте его на части или используйте сжатие (ZIP), но помните: внутри архива файл всё равно не должен превышать лимит.

Кодировка CSV - частая проблема. ChatGPT ожидает UTF-8. Если ваш CSV сохранён в Windows-1251 (русская кириллица в Excel), символы отобразятся кракозябрами. Решение: перед загрузкой пересохраните файл в UTF-8. В Excel: «Файл» -> «Сохранить как» -> «CSV UTF-8 (разделители - запятые)». В Google Sheets: «Файл» -> «Скачать» -> «CSV (текущий лист)» - он автоматически даёт UTF-8. Если используете «Блокнот» или Notepad++, откройте CSV, выберите «Кодировки» -> «Преобразовать в UTF-8» и сохраните.

Разделители в CSV: по умолчанию запятая. Но русская версия Excel часто использует точку с запятой. ChatGPT это понимает, но лучше явно указать в запросе: «разделитель - точка с запятой». Или пересохраните с запятыми.

Excel (.xlsx): удобно, но с нюансами

ChatGPT читает .xlsx файлы, но только первый лист. Если у вас книга с несколькими листами, объедините нужные данные на один лист или загружайте каждый лист отдельным файлом. Формулы не вычисляются - ChatGPT видит только значения, которые были на момент последнего сохранения. Если в ячейке формула =A1+B1, а A1 и B1 пусты, вы получите 0 или пустоту. Перед загрузкой скопируйте столбец с формулами и вставьте как значения (специальная вставка -> значения).

Максимальное количество строк и столбцов: ChatGPT не документирует жёсткие лимиты, но на практике файлы до 100 000 строк и 50 столбцов обрабатываются стабильно. Больше - возможны таймауты или ошибки «слишком большой файл». Решение: загружайте выборку (каждую 10-ю строку) или агрегируйте данные (суммы, средние по группам) прямо в Excel перед загрузкой.

Кодировки и специальные символы

Для .xlsx кодировка не проблема - внутри это ZIP-архив с XML, Unicode. Для CSV - только UTF-8. Если в данных есть кавычки, запятые внутри текста или переносы строк, CSV должен быть правильно экранирован: текст в двойных кавычках, внутренние кавычки удваиваются. ChatGPT справляется с корректным CSV, но битые файлы (например, из кривого экспорта 1С) могут вызвать ошибки. Проверьте CSV в любом текстовом редакторе: данные должны быть ровными колонками.

Практический чек-лист перед загрузкой

  1. Сохраните файл в UTF-8 (CSV) или .xlsx (один лист).
  2. Убедитесь, что нет объединённых ячеек - они читаются как пустые.
  3. Удалите лишние строки с заголовками, примечаниями, итогами внизу таблицы.
  4. Названия столбцов - одной строкой, без пробелов в начале, латиница или кириллица без спецсимволов (лучше латиница).
  5. Если файл больше 50 МБ, загрузите образец (первые 1000 строк) и скажите ChatGPT: «Вот образец, полный файл весит 200 МБ, как анализировать по частям?».

После загрузки дайте команду: «Покажи первые 5 строк, чтобы я убедился, что данные прочитаны верно». Если видите кракозябры - проблема в кодировке, пересохраняйте. Если пустые ячейки там, где должны быть числа - проверьте разделитель целой и дробной части (запятая vs точка). ChatGPT понимает оба варианта, но в одном столбце должен быть единый формат.

Первые вопросы по данным: сводная статистика и поиск аномалий

Когда вы загрузили файл, первым делом нужно понять, что у вас за данные. Попросите ChatGPT: «Дай сводную статистику по всем числовым столбцам: среднее, медиану, минимум, максимум, стандартное отклонение». Это заменит ручной просмотр сотен строк.

Разберём на примере турагентства (пример, не реальный кейс автора). У вас CSV с колонками: дата бронирования, страна, сумма тура, количество туристов. ChatGPT покажет, что средняя сумма тура - 120 000 руб., но есть выбросы до 500 000 руб. Вы просите: «Найди аномалии - туры, где сумма больше 400 000 или меньше 10 000». ChatGPT отфильтрует их и покажет список. Это поможет выявить ошибки ввода или мошеннические брони.

Для поиска аномалий можно попросить: «Построй ящик с усами (boxplot) для столбца "Сумма тура"». ChatGPT сгенерирует график, где точки за пределами «усов» - это выбросы.

Построение графиков: гистограммы, scatter, тренды

После загрузки данных вы можете сразу переходить к визуализации. ChatGPT генерирует код на Python с библиотеками matplotlib и seaborn, а графики рисует прямо в чате. Для этого не нужно устанавливать софт.

Гистограмма (распределение)

Чтобы увидеть, как распределены числовые значения, дайте команду: «Построй гистограмму для столбца "Сумма"». ChatGPT автоматически подберёт количество столбцов и подпишет оси. Если нужно настроить детализацию, уточните: «Сделай 20 бинов, добавь сетку и подпиши ось X как "Сумма (руб.)"». Для сравнения двух распределений на одном графике используйте: «Построй две гистограммы с прозрачностью 0.5 для колонок "Выручка" и "Себестоимость" на одном полотне».

Scatter plot (диаграмма рассеяния)

Scatter помогает выявить взаимосвязь между двумя числовыми переменными. Пример запроса: «Построй scatter plot: по оси X - "Рекламный бюджет", по оси Y - "Продажи"». ChatGPT добавит точки и линию регрессии, если вы попросите: «Добавь линию тренда и коэффициент корреляции Пирсона в угол графика». Для цветовой кодировки по категориям укажите: «Окрась точки по столбцу "Регион", добавь легенду».

Тренды и временные ряды

Если данные содержат даты, ChatGPT построит линейный график с трендом. Запрос: «Построй временной ряд: по X - "Дата", по Y - "Выручка". Добавь скользящее среднее с окном 7 дней». Модель сама преобразует строки в datetime, если это необходимо. Для множественных линий: «На одном графике покажи тренды по "Выручке" и "Расходам" за 2023 год, подпиши каждую линию».

Кастомизация и экспорт

Вы можете управлять стилем: «Сделай график в стиле "whitegrid" seaborn, размер 10x6 дюймов, шрифт 12». После построения ChatGPT предложит скачать изображение в PNG или PDF. Если нужно сохранить данные для отчета, попросите: «Выведи код Python, который сгенерировал этот график». Это позволит воспроизвести визуализацию локально.

Ограничения

ChatGPT не строит 3D-графики и сложные анимации. Для интерактивных дашбордов (plotly) потребуется явный запрос: «Сделай интерактивный scatter с подсказками при наведении». Модель также может ошибаться в подборе типа графика - если scatter выглядит как «лапша» из тысяч точек, попросите уменьшить прозрачность (alpha=0.3) или применить jitter.

Практический пример

Допустим, у вас CSV с колонками: date, revenue, marketing_spend, region. Запрос: «Построй 3 графика рядом: 1) гистограмма revenue, 2) scatter marketing_spend vs revenue с цветом по region, 3) временной ряд revenue с трендом. Размести их в одной строке». ChatGPT сгенерирует subplot-композицию за 10 секунд.

Главное правило: чем точнее запрос, тем качественнее график. Указывайте названия колонок в кавычках, тип графика и желаемые параметры. Модель не умеет «угадывать» - она выполняет инструкции.

Фильтрация и трансформация данных через естественный язык

ChatGPT позволяет управлять данными без написания сложных формул или кода. Вам достаточно описать задачу своими словами, и модель выполнит фильтрацию, сортировку, создание новых столбцов или агрегацию.

Как это работает. После загрузки файла ChatGPT анализирует структуру таблицы: названия столбцов, типы данных, первые строки. Вы даете команду на естественном языке, а модель генерирует код Python (обычно с библиотекой pandas) и выполняет его в фоновом режиме. Результат отображается в виде обновленной таблицы или нового файла для скачивания.

Примеры фильтрации. Самый частый запрос - отбор строк по условию. Например: «Оставь только строки, где сумма продаж больше 1000» или «Покажи заказы за 2024 год». ChatGPT сам определит столбец с датами и выполнит фильтр. Если нужно несколько условий: «Отфильтруй клиентов из Москвы и Санкт-Петербурга с суммой заказа от 5000». Модель корректно обработает логическое «И» и «ИЛИ».

Сортировка. Просто скажите: «Отсортируй по убыванию цены» или «Сначала самые старые записи». ChatGPT применит сортировку к нужному столбцу.

Трансформация данных. Это создание новых столбцов на основе существующих. Примеры запросов:

  • «Добавь столбец с прибылью как разница между ценой и себестоимостью».
  • «Раздели ФИО на три отдельных столбца: фамилия, имя, отчество».
  • «Переведи все даты в формат ДД.ММ.ГГГГ».
  • «Объедини столбцы "Город" и "Улица" в один адрес через запятую».

Агрегация и группировка. ChatGPT легко сводит данные: «Сгруппируй по категории товара и посчитай среднюю цену» или «Покажи общую выручку по месяцам». Результат - новая таблица с итогами.

Очистка данных. Модель справляется с типовыми проблемами: «Удали строки с пустыми ячейками в столбце "Email"», «Замени все пропуски в цене на 0», «Убери дубликаты по номеру заказа».

Важные ограничения. ChatGPT не видит весь файл целиком, если он большой (более 100 МБ). Для больших данных лучше загружать выборку или использовать режим Advanced Data Analysis (если доступен). Также модель может ошибиться в названиях столбцов, если они нечитаемые (например, «Col1», «Col2»). В таком случае сначала попросите: «Переименуй столбцы: Col1 в "Дата", Col2 в "Сумма"».

Как проверить результат. После выполнения запроса ChatGPT покажет первые строки измененной таблицы. Если что-то не так, уточните: «Ты отфильтровал не те строки, попробуй условие "больше или равно 100"». Модель исправит ошибку.

Практический совет. Формулируйте запрос максимально конкретно. Вместо «Почисти данные» напишите «Удали строки, где возраст меньше 18 или отсутствует». Чем точнее команда, тем выше качество результата.

Фильтрация и трансформация через естественный язык сокращает время на рутинные операции в 5-10 раз. Вы перестаете зависеть от знания Excel или SQL и сосредотачиваетесь на анализе, а не на технической возне с данными.

Слияние нескольких таблиц: VPR средствами ChatGPT

Для слияния нескольких таблиц в ChatGPT не нужно писать сложные формулы ВПР. Просто загрузите обе таблицы и дайте команду на естественном языке.

Разберём на примере ecom-магазина (пример, не реальный кейс автора). У вас есть таблица заказов: ID заказа, товар, сумма. И таблица клиентов: ID клиента, имя, регион. Вы хотите добавить регион клиента в таблицу заказов.

Загрузите оба файла в ChatGPT и скажите: «Слей таблицы по столбцу "ID клиента" - добавь столбец "Регион" из второй таблицы в первую». ChatGPT выполнит слияние (join) и покажет результат. Если ключи называются по-разному, уточните: «В первой таблице столбец "КлиентID", во второй - "ID". Слей по ним».

ChatGPT поддерживает все типы слияния: левое, правое, внутреннее, внешнее. Если вам нужны только те строки, которые есть в обеих таблицах, скажите: «Сделай внутреннее слияние, чтобы остались только заказы с известными клиентами».

Экспорт результатов: скачать обработанный CSV и Python-скрипт

После того как ChatGPT выполнил очистку данных, агрегацию или построил графики, вам нужно забрать результат. ChatGPT не имеет кнопки «Скачать файл», но он может сгенерировать два полезных артефакта: готовый CSV-файл в виде текста и Python-скрипт, который воспроизводит все ваши действия.

Как получить CSV

Попросите ChatGPT прямо: «Выдай итоговую таблицу в формате CSV». Модель выведет данные в виде текста, где строки разделены переводами строк, а столбцы - запятыми. Скопируйте этот текст в блокнот и сохраните с расширением .csv. Если в данных есть запятые внутри ячеек, ChatGPT должен обернуть их в кавычки. Проверьте это: если кавычек нет, попросите «Оберни все поля в двойные кавычки».

Для больших таблиц (более 50 строк) ChatGPT может обрезать вывод. В этом случае запросите: «Выдай первые 10 строк для примера, а затем полный CSV в виде текстового файла, разбитого на части по 100 строк». Склейте части вручную, удалив заголовки из повторений. Альтернатива: попросите сгенерировать Python-скрипт, который сохраняет DataFrame в CSV, и запустите его локально.

Как получить Python-скрипт

Самый надежный способ экспорта - попросить ChatGPT написать скрипт, который загружает исходный файл, применяет все сделанные преобразования и сохраняет результат. Скажите: «Напиши Python-скрипт, который делает то же самое: читает файл data.csv, удаляет пропуски, группирует по столбцу "Город", считает среднюю сумму, строит столбчатую диаграмму и сохраняет итоговую таблицу в cleaned_data.csv». ChatGPT выдаст готовый код с импортами pandas, matplotlib и openpyxl.

Скопируйте код в файл с расширением .py. Убедитесь, что в первой строке указан путь к вашему исходному файлу. Если ChatGPT использовал абсолютный путь (например, /content/data.csv), замените его на относительный (data.csv) или полный путь к вашему файлу. Запустите скрипт в любой среде: терминал, Jupyter Notebook, Google Colab. На выходе получите CSV и PNG-файл с графиком.

Практические советы

  • Если вы работали с Excel (несколько листов), явно укажите ChatGPT: «Скрипт должен читать лист "Продажи" из файла report.xlsx».
  • Для графиков попросите добавить в скрипт plt.savefig('chart.png', dpi=300) перед plt.show().
  • Если ChatGPT использовал библиотеки, которых у вас нет (например, seaborn), попросите заменить на matplotlib или pandas.
  • Всегда просите добавить обработку ошибок: try-except для чтения файла и проверку существования столбцов.

Когда нужен только CSV

Если вам не нужен скрипт, а только финальные данные, попросите: «Выдай таблицу в формате Markdown, а затем в формате CSV». Markdown удобен для вставки в документацию, CSV - для загрузки в Excel. Проверьте, что ChatGPT не потерял строки: сравните количество строк в исходных данных и в выводе.

Итог

Экспорт через ChatGPT - это два шага: скопировать текст CSV или скопировать код. Второй вариант предпочтительнее, если вы планируете повторять анализ или обрабатывать похожие файлы. Скрипт можно адаптировать под новые данные, просто изменив имя файла. Никогда не доверяйте выводу ChatGPT на 100%: проверьте итоговый CSV на наличие артефактов (лишние запятые, пропущенные строки) и запустите скрипт на тестовом файле перед использованием.

Ограничения и типичные ошибки при анализе больших файлов

ChatGPT не предназначен для обработки файлов, размер которых превышает десятки мегабайт. Даже если файл формально загружается, модель может «забыть» часть данных или выдать некорректные результаты. Основное ограничение - контекстное окно: ChatGPT одновременно «видит» только ограниченный объём информации. Если ваш Excel или CSV содержит 100 000 строк, модель обработает лишь первые несколько тысяч, а остальные проигнорирует. Это приводит к ошибкам в расчётах средних, сумм и других агрегатов.

Типичная ошибка - попытка загрузить файл с миллионом строк и попросить «посчитать статистику по всем данным». ChatGPT либо зависнет, либо выдаст результат только по начальному фрагменту. Решение: перед загрузкой уменьшите объём данных. Удалите лишние столбцы, оставьте только нужные строки, используйте фильтры в Excel или скрипты для агрегации. Например, если нужно проанализировать продажи за год, сгруппируйте данные по месяцам или неделям заранее.

Вторая распространённая ошибка - работа с файлами, содержащими неструктурированный текст или бинарные данные. ChatGPT плохо парсит сложные форматы: вложенные таблицы, объединённые ячейки, макросы, изображения внутри Excel. Если файл содержит такие элементы, модель может прочитать только часть информации или интерпретировать её неверно. Перед загрузкой преобразуйте данные в простую таблицу: один лист, без объединений, все значения в отдельных ячейках. CSV-формат с разделителями-запятыми - самый надёжный вариант.

Третья проблема - игнорирование типов данных. ChatGPT может спутать числа, записанные как текст, с фактическими числами. Например, столбец с ценами, где используется запятая как десятичный разделитель (12,5 вместо 12.5), модель воспримет как строку. В результате графики не построятся, а суммы окажутся нулевыми. Всегда проверяйте формат данных перед загрузкой: замените запятые на точки, убедитесь, что даты записаны в едином формате (ГГГГ-ММ-ДД), а пустые ячейки явно обозначены (например, «0» или «NA»).

Четвёртая ошибка - запросы на построение сложных графиков без указания осей и типов данных. ChatGPT может нарисовать диаграмму, но если не уточнить, какие столбцы отвечают за X и Y, результат будет случайным. Всегда формулируйте запрос чётко: «Построй столбчатую диаграмму, где по оси X - столбец "Месяц", по оси Y - столбец "Продажи"». Если данных много, график может не поместиться в ответе - запрашивайте только ключевые визуализации.

Пятая ошибка - перегрузка модели одним запросом. Не просите одновременно «посчитать среднее, медиану, построить три графика, найти выбросы и сделать прогноз». ChatGPT начнёт выполнять задачи последовательно, но к концу может потерять нить или выдать неполный ответ. Разбивайте анализ на шаги: сначала загрузите данные и попросите базовую статистику, затем - один график, потом - дополнительные расчёты.

Наконец, помните о конфиденциальности. Не загружайте в ChatGPT файлы с персональными данными, паролями или коммерческой тайной. Модель обрабатывает информацию на серверах OpenAI, и данные могут использоваться для обучения. Если анализ критичен, используйте локальные инструменты (Python, R, Excel) или корпоративные версии ChatGPT с гарантией приватности.

Чтобы избежать ошибок, всегда проверяйте результаты: сравнивайте суммы и средние с исходными данными в Excel. Если ChatGPT выдаёт странные цифры - скорее всего, файл слишком велик или содержит нечитаемые элементы. Уменьшите объём, очистите формат и повторите запрос.

Частые вопросы

Какой максимальный размер файла можно загрузить?

Максимальный размер файла, который можно загрузить, составляет 50 мегабайт. Этот размер подходит для большинства таблиц и наборов данных. Если ваш файл больше, его необходимо разбить на более мелкие части или использовать другие методы для его обработки. Это ограничение обеспечивает стабильную работу инструмента.

ChatGPT видит мой файл или просто запускает код?

ChatGPT не имеет прямого доступа к вашим файлам, он запускает код на основе ваших инструкций. Это означает, что вы должны предоставить данные или код в текстовом формате, чтобы ChatGPT мог их обработать. Так вы сохраняете контроль над своими данными и определяете, что именно будет обработано.

Как сохранить написанный ChatGPT Python-код?

Чтобы сохранить написанный Python-код, скопируйте его и вставьте в текстовый редактор или IDE, например, PyCharm или Visual Studio Code. Затем сохраните файл с расширением .py. Также можно использовать онлайн-редакторы кода, которые позволяют сохранять и загружать файлы. Это позволит вам использовать код в будущем и продолжить работу над проектом.

Работает ли Code Interpreter в бесплатной версии?

Code Interpreter доступен только в платной версии. Для работы с данными в бесплатной версии необходимо использовать другие методы. Однако ChatGPT может помочь с некоторыми задачами по обработке и анализу данных без использования Code Interpreter. Это может включать выполнение простых вычислений и предоставление советов по работе с данными.

Что дальше

Следующий шаг: попробуйте загрузить свой первый CSV-файл с продажами и попросите ChatGPT построить график выручки по месяцам. Это займёт 10 минут и даст готовый отчёт.

AI Компас (t.me/kosmoslab_ai) - канал для предпринимателей в РФ и СНГ, которые применяют AI в своём бизнесе без программиста. Разбираем инструменты и схемы - без курсов и теории.

Читайте дальше

Учебник

AI-бот в Telegram за 20 минут без программиста

Ваши менеджеры тратят часы на ответы в Telegram, а клиенты ждут. AI-мост превращает мессенджер в умного помощника: пользователь пишет боту, а он передаёт запрос ChatGPT или Claude и возвращает ответ. Никакого кода - только визуальные конструкторы. Разберём схему, инструменты (Botpress, n8n, Make) и ограничения, чтобы вы сразу поняли, подходит ли это вашему бизнесу.

Учебник

Telegram-бот с AI для ответов клиентам без кода

Ваши менеджеры тратят часы на однотипные вопросы клиентов, а вы теряете заявки? Вот как за 30 минут собрать Telegram-бота с GPT, который отвечает на вопросы по вашим документам. Без кода, серверов и программиста. Бесплатный план Botpress - 2000 сообщений в месяц.

Учебник

Сценарий для YouTube, Reels или TikTok: пишет AI

Ваш контент-менеджер тратит полдня на сценарий для видео, а результат все равно не держит внимание. Разбираем готовые промпты для ChatGPT и Claude, которые за час создают хук, структуру и b-roll. Без найма сценариста и курсов по монтажу.