Сегодня разместил свой первый самостоятельный проект – исследование на платформе GitHub
https://github.com/eddydewrussia/my_own_research/tree/main/My_Muzil_Royalty_3Q_2021
Сегодня разместил свой первый самостоятельный проект – исследование на платформе GitHub
https://github.com/eddydewrussia/my_own_research/tree/main/My_Muzil_Royalty_3Q_2021
import pandas as pd dash_visits = pd.read_csv('https://eddydewrussia.ru/download/dash_visits/?wpdmdl=5230&masterkey=nLdyJ3VbW1PZ2e_TA4xbcsuZHTYHaoPLnQHpPVvTMozIw3dkLuxX5-CJKOi30tWiqjk_HX_E17pTlXEe1qE2IcJXZM099Ooh0bYFK4HBug4') # функция для вывода информации о данных def dataset_info(data): print('\033[1m' + 'Строки - полные дубликаты:' + '\033[0m') display(data[data.duplicated(keep=False)]) print('\033[1m' + 'Названия колонок:' + '\033[0m') print(data.columns) print() print('\033[1m' + 'Первые строки:' + '\033[0m') display(data.head(3)) print('\033[1m' + 'Информация о датафрэйм:' + '\033[0m') display(data.info()) print('\033[1m' + "describe" + '\033[0m') display(data.describe()) print('\033[1m' + "Количества и доли отсутствующих значений" + '\033[0m') display(pd.concat([data.isna().sum(), data.isna().mean()], axis=1)\ .rename(columns={0:'кол-во', 1:'доля'})\ .style.format({'кол-во':'{:.0f}', 'доля':'{:.2%}'})) # применение функции dataset_info(dash_visits)
pandas python dataframe
Определить, нет ли повторов значений в колонке с номерами идентификаторов.
(проверка на уникальность значений)
import pandas as pd dash_visits = pd.read_csv('https://eddydewrussia.ru/download/dash_visits/?wpdmdl=5230&masterkey=nLdyJ3VbW1PZ2e_TA4xbcsuZHTYHaoPLnQHpPVvTMozIw3dkLuxX5-CJKOi30tWiqjk_HX_E17pTlXEe1qE2IcJXZM099Ooh0bYFK4HBug4') # print(dash_visits['record_id'].nunique(), "количество уникальных значений") print(len(dash_visits), "количестов строк в таблице") if ((len(dash_visits) - dash_visits['record_id'].nunique()) == 0): print("значения в колонке не повторяются") else: print("есть повторы")
pandas python dataframe
Я сдал учебный проект на тему визуализации результатов исследования.
В курсе Анализ данных в Яндекс.Практикуме.
Запрос бизнеса звучал так:
“Сможет ли новый ресторан
с официантами-роботами
снискать популярность на долгое время,
когда все зеваки насмотрятся на роботов-официантов?”
Само исследование предоставленных данных занимает более 90 страниц.
А результат – всего лишь 8 слайдов. )))
Такие эмоции я ощутил сегодня.
Я помог найти причину ошибки, из-за которой останавливалось выполнение программы на Питоне