Информация про датафрейм

Как вывести полную информацию про данные в таблице

[snippet slug=informacija-pro-datafrejm lang=python]

Результат

Строки - полные дубликаты:
Unnamed: 0 record_id item_topic source_topic age_segment dt visits
Названия колонок:
Index(['Unnamed: 0', 'record_id', 'item_topic', 'source_topic', 'age_segment',
       'dt', 'visits'],
      dtype='object')

Первые строки:
Unnamed: 0 record_id item_topic source_topic age_segment dt visits
0 0 1040597 Деньги Авто 18-25 2019-09-24 18:32:00 3
1 1 1040598 Деньги Авто 18-25 2019-09-24 18:35:00 1
2 2 1040599 Деньги Авто 18-25 2019-09-24 18:54:00 4
Информация о датафрэйм:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 30745 entries, 0 to 30744
Data columns (total 7 columns):
 #   Column        Non-Null Count  Dtype 
---  ------        --------------  ----- 
 0   Unnamed: 0    30745 non-null  int64 
 1   record_id     30745 non-null  int64 
 2   item_topic    30745 non-null  object
 3   source_topic  30745 non-null  object
 4   age_segment   30745 non-null  object
 5   dt            30745 non-null  object
 6   visits        30745 non-null  int64 
dtypes: int64(3), object(4)
memory usage: 1.6+ MB
None
describe
Unnamed: 0 record_id visits
count 30745.00000 3.074500e+04 30745.000000
mean 15372.00000 1.055969e+06 10.089673
std 8875.46135 8.875461e+03 19.727601
min 0.00000 1.040597e+06 1.000000
25% 7686.00000 1.048283e+06 1.000000
50% 15372.00000 1.055969e+06 3.000000
75% 23058.00000 1.063655e+06 10.000000
max 30744.00000 1.071341e+06 371.000000
Количества и доли отсутствующих значений
  кол-во доля
Unnamed: 0 0 0.00%
record_id 0 0.00%
item_topic 0 0.00%
source_topic 0 0.00%
age_segment 0 0.00%
dt 0 0.00%
visits 0 0.00%

pandas python dataframe

Статья понравилась?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *