Читать «Графики, которые убеждают всех» онлайн - страница 34

Александр Андреевич Богачев

Приблизительность недопустима

Нельзя показывать данные в графической форме приблизительно. Это самая частая ошибка при визуализации данных. Значительная часть постов в моем канале о визуализации данных «Чартомойка» посвящена именно этой ошибке:

Каждое следующее значение выглядит больше предыдущего, это соответствует истинному положению дел. Однако пропорции длин столбиков не соответствуют разнице между значениями: график вводит в заблуждение относительно темпов роста показателя. Сейчас рост выглядит не таким значительным. Вот так корректно:

Подобная приблизительная визуализация превращает всю затею в бессмыслицу, профанирует ее. Ведь смысл в том, чтобы человек мог наглядно считать значения, не вчитываясь в сами цифры. Процесс восприятия при этом работает очень быстро.

Делать приблизительную визуализацию данных здесь – все равно что вместо значений 66,11, 174,29 и 280,92 написать 66, 75 и 90. Наверняка вы бы не стали так делать. Подобных визуализаций встречается, увы, очень много.

В большинстве случаев подобная ошибка возникает не от злого умысла, а непреднамеренно. Дизайнер вручную, без программ для построения графиков, рисует инфографику. Он просто не понимает, что точность и пропорциональность между значениями надо непременно соблюдать.

На примере этой ошибки можно обозначить еще один принцип.

График можно назвать удачным, если вы уберете все подписи, но при этом будет очевидно, какие значения больше, а какие меньше и насколько.

Столбиковые диаграммы всегда от нуля

Столбиковые диаграммы всегда строятся от нуля. Тем, кто не сталкивается плотно с визуализацией данных, часто кажется, что в этом нет ничего плохого. Поэтому мы повсеместно с этим встречаемся: во многих презентациях и даже на ТВ.

Однако это достаточно серьезная ошибка, и ее следует избегать.

Дело в том, что в столбиковой диаграмме значение кодируется всей длиной столбика. Когда рядом находятся два столбика, для сравнения мы оцениваем именно их длину. В примере выше создается впечатление двукратной разницы возраста выхода на пенсию у мужчин и женщин.

Это было бы особенно заметно, если бы со столбиков убрали подписи.

Обрезая часть столбика, мы уменьшаем и само значение, которое он кодирует. Это делает визуализацию бессмысленной. Если на приведенном скриншоте убрать подписи, можно подумать, что у мужчин возраст выхода на пенсию в два раза больше, чем у женщин.

Сейчас длина столбика кодирует не возраст выхода на пенсию. Она показывает, сколько лет спустя после наступления 50 лет выходят на пенсию мужчины и женщины. Это бессмыслица.

Конечно, так делать не стоит. Столбиковая диаграмма всегда строится от нуля.

Но как же быть в ситуации, когда разница между значениями так мала, что при показе столбиков может быть не видна вовсе?

В этом случае столбики можно заменять точками или отсечками/отрезками. Значение в них кодируется не длиной, а положением относительно оси с подписанными метками.