Архив метки: dataframe

Хакатон Екб

С пятницы по воскресенье, в Екатеринбурге и онлайн, прошёл хакатон под патронажем МинСтроя России.

Кейсы (задания) там были разные.

Команда, частью которой я стал, взялась за задачу, целью которой было на основании имеющихся факторов, спрогнозировать изменение графика выполнения работ.

В любом хакатоне важно не только то, какое место заняла команда. Не менее важно то, какой вклад внёс ты, как член коллектива.

Я помог понять, чего же от нас ожидает заказчик.

Помогал вовремя выполнять график соревнования.

И наполнял команду оптимизмом.

В результате нашего коллективного труда, мы заняло место основательной середины.

А какой ваш опыт участия в соревнованиях?

Статья понравилась?

Проект для ВК

Делаю проект по анализу данных для заявки на стажировку в ВК.

Знаю точно, что не сделаю полностью.

Отправлю с последним абзацем в котором напиши что-то типа такого:

А далее проводим категоризацию методом случайного леса.

… в работе пользуюсь новым поиском Бинга с элементами ИИ. …

Статья понравилась?

Замена значений в пандах по словарю

Часто для целей анализа бывает необходимым заменить значения в ячейках таблицы DataFrame на другие. Например, на короткие их версии, Или вообще нумерованные.

В приводимом примере замена

  • Для программы важно понять над чем вам нужно поработать. Не переживайте, вам будут доступны все опции.

на

  • q1

и т д

Вот вариант кода замены с использованием циклов в pandas:

[snippet slug=zamena-znachenija-v-jachejkah-dataframe-pandas lang=python]

Статья понравилась?

Двухэтажные название колонок

После комплексной группировки таблицы pandas Pynhon dataframe командой groupby напрмер применив такую строку

[snippet slug=gruppirovka lang=python]

Получаем двухэтажное название колонок в итоговой таблице.

Ещё они называются иерархические индексы

Пример dataframe с двухэтажными колонками

Выглядит это очень красиво. Но при попытке обратиться к колонке по названию, возникает сложность.

Что же делать?

Трансформировать иерархические названия столбцов pandas

Вот непонятная, но эффективная строка для этого

[snippet slug=sglazhivanie-nazvanij-kolonok lang=python]

И получим результат сглаживания

Не земетили подвох?
Статья понравилась?

Как прочесть csv файл с Яндекс Диска в pandas

Яндекс.Диск официально не предоставляет сервис прямого считывания файлов по прямой ссылке.

Публичная ссылка на файл открывается в окне браузера. И уже в этом окне есть ссылка для скачивания.

Но в задачах анализа данных бывает необходимо в тетрадке Юпитер.Ноутбука прямо считывать данные в переменную из облачного хранилища.

Самый популярный в РФ ресурс для хранения файлов сейчас – это Яндекс.Диск.

Вот пример кода на Python для чтения файла:

[snippet slug=chtenie-fajla-iz-jandeks-diska lang=abap]

Конечно же, может потребоваться подбор кодовой страницы файла и разделителя.

Ну это как для любого файла csv .

Статья понравилась?