Как вывести полную информацию про данные в таблице
[snippet slug=informacija-pro-datafrejm lang=python]
Результат
Строки - полные дубликаты:
Unnamed: 0 | record_id | item_topic | source_topic | age_segment | dt | visits |
---|
Названия колонок: Index(['Unnamed: 0', 'record_id', 'item_topic', 'source_topic', 'age_segment', 'dt', 'visits'], dtype='object') Первые строки:
Unnamed: 0 | record_id | item_topic | source_topic | age_segment | dt | visits | |
---|---|---|---|---|---|---|---|
0 | 0 | 1040597 | Деньги | Авто | 18-25 | 2019-09-24 18:32:00 | 3 |
1 | 1 | 1040598 | Деньги | Авто | 18-25 | 2019-09-24 18:35:00 | 1 |
2 | 2 | 1040599 | Деньги | Авто | 18-25 | 2019-09-24 18:54:00 | 4 |
Информация о датафрэйм:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 30745 entries, 0 to 30744
Data columns (total 7 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Unnamed: 0 30745 non-null int64
1 record_id 30745 non-null int64
2 item_topic 30745 non-null object
3 source_topic 30745 non-null object
4 age_segment 30745 non-null object
5 dt 30745 non-null object
6 visits 30745 non-null int64
dtypes: int64(3), object(4)
memory usage: 1.6+ MB
None
describe
Unnamed: 0 | record_id | visits | |
---|---|---|---|
count | 30745.00000 | 3.074500e+04 | 30745.000000 |
mean | 15372.00000 | 1.055969e+06 | 10.089673 |
std | 8875.46135 | 8.875461e+03 | 19.727601 |
min | 0.00000 | 1.040597e+06 | 1.000000 |
25% | 7686.00000 | 1.048283e+06 | 1.000000 |
50% | 15372.00000 | 1.055969e+06 | 3.000000 |
75% | 23058.00000 | 1.063655e+06 | 10.000000 |
max | 30744.00000 | 1.071341e+06 | 371.000000 |
Количества и доли отсутствующих значений
кол-во | доля | |
---|---|---|
Unnamed: 0 | 0 | 0.00% |
record_id | 0 | 0.00% |
item_topic | 0 | 0.00% |
source_topic | 0 | 0.00% |
age_segment | 0 | 0.00% |
dt | 0 | 0.00% |
visits | 0 | 0.00% |
pandas python dataframe