تجسم یک مسیر مستقیم از رویا به واقعیت نیست. پر از پیچ و خم ها، مسیرهای خرگوش و بلوک های جاده، اشتباهات و شکست هاست. فرضیه های اولیه اغلب اشتباه هستند و مسیرهای امیدوارکننده اغلب بن بست هستند. تکرار ضروری است. و گاهی اوقات برای رسیدن به آنها باید اهداف خود را تغییر دهید.
ما به اندازه دیگران در پیگیری فرضیه های نادرست ماهر هستیم. اجازه دهید به شما نشان دهیم.
ما Hierarchical Edge Bundling را دیده بودیم که توسط Mike Bostock در D3 اجرا شد. این واقعاً الگوهایی را که با استفاده از خطوط مستقیم تقریباً کاملاً مبهم بودند، روشن کرد.
ما کنجکاو بودیم که آیا می تواند همین کار را با الگوهای جغرافیایی انجام دهد. به نظر می رسد که دنی هولتن، خالق این الگوریتم، قبلاً کاری مشابه انجام داده است. اما باید آن را با داده های خودمان می دیدیم.
ما برخی از داده های مهاجرت ایالت به ایالت را از اداره سرشماری ایالات متحده گرفتیم، سپس کد کورنلیو شکر را برای انجام خوشه بندی لبه های هدایت شده اجباری پیدا کردیم و دست به کار شدیم.
برای شروع، ما به سادگی داده های مهاجرت برای یک سال (2014) را روی نقشه قرار می دهیم. اولین برداشت ما: اندوه، ناامیدی و بدبختی. به نظر بهتر از خطوط مستقیم به هم ریخته بود، اما نه خیلی بهتر. گرچه چانه. این هنوز تعداد افراد بین هر یک از پیوندها را محاسبه نمی کند – فقط اینکه آیا یک پیوند وجود دارد یا نه.
با گروهبندی لبهها، هر مسیر بین دو نقطه را میتوان دارای گرانشی دانست که مسیرهای دیگر را به سمت خود میکشد، در حالی که خود توسط آن مسیرهای دیگر کشیده میشود. در تکرار اول، هر قسمت از مسیر دارای جاذبه یکسانی است. با تغییر کد وزن بسته، به جاده هایی که افراد بیشتری در آن تردد می کنند، جاذبه اضافه می کنیم.
افسوس، همه چیز تغییر چندانی نکرده است. و پردازش با همه آن جریان ها زمان زیادی می برد. وقتی کار سخت شد، ساده کنید. ما داده ها را به دو نیمه تقسیم کردیم و جریان های به سمت غرب را با جریان های به سمت شرق مقایسه کردیم.
داده های کمتر به معنای نقشه های تمیزتر است. ما فرض کردیم تفاوت آشکاری بین این دو وجود دارد، اما این کارت ها ممکن است دوقلو باشند. ما در واقع باید بین آنها رفت و آمد می کردیم تا ببینیم واقعاً تفاوت وجود دارد.
بنابراین رویاهای ما درباره بینش شگفتانگیز درباره مجموعه داده مهاجرت با استفاده از خوشهبندی مرزی شکست خورد. اما دیدن یک تجسم به طور منظم منجر به ایده هایی برای دیگری می شود. ما فکر کردیم اگر خطوط را از مبدا به مقصد متحرک کنیم چه اتفاقی میافتد؟ برای سادگی، ما فقط با مهاجرت به شرق شروع کردیم.
عالی است، مانند نور لیزر است که به آرامی از طریق کابل های فیبر نوری نامرئی جریان می یابد. اما یک مشکل وجود دارد. به نظر میرسد جریانهای طولانیتر حجم بیشتری را نشان میدهند (که گمراهکننده است، زیرا طول آنها در واقع حجم را رمزگذاری نمیکند، فقط فاصله را نشان میدهد). بنابراین ما سعی کردیم از طول خطوط دیفرانسیل برای نشان دادن تعداد افراد استفاده کنیم و فقط به جریانهای شرق بچسبیم.
در اینجا ما ایده بهتری از منابع بزرگتر، به خصوص در اوایل انیمیشن پیدا می کنیم، اما برای برخی از مسیرها، مانند کالیفرنیا به نوادا، ما در نهایت برای اکثر حلقه ها یک خط ثابت داریم. فاصله جغرافیایی کوتاه، مهاجرت زیاد مردم را پوشانده است. ما تعجب کردیم که آیا استفاده از خطوط چین این مشکل را برطرف می کند – به خصوص در پیوندهایی مانند کالیفرنیا به نوادا.
این به ما یک رگبار مسلسل در شروع می دهد که همه چیز به 50 سوراخ کوچک در انتهای آن تخلیه می شود. ما این حس حرکت را برای کشورهای نزدیک جغرافیایی دریافت می کنیم، اما بصری با مدل ذهنی ما از مهاجرت مطابقت ندارد. مهاجران در ابتدای سال صف نمی کشند، همان موقع می روند و می رسند. مهاجرت آنها در طول سال توزیع می شود.
چه می شود اگر به جای آن اعداد مهاجرت را به نرخ جریان تبدیل کنیم. ما می توانیم نقاطی را در مسیرهای متناهی خود که هر نقطه نشان دهنده 1000 نفر است حرکت دهیم و مهاجرت آنها را تماشا کنیم. چگالی نقاط در طول مسیر نشان دهنده حجم خواهد بود. این همچنین به راحتی قابل توضیح است.
ما هنوز یک فعالیت انفجاری (مانند سیگنالهای رادار) در ابتدای حلقه داریم، بنابراین زمانهای شروع را برای حذف آن اثر موج دار تغییر میدهیم.
اینجاست. این در نهایت تجسمی به ما می دهد که با مدل ذهنی ما مطابقت دارد: افرادی که در این دوره از یک حالت به حالت دیگر حرکت می کنند. بیایید یک حرکت معکوس به غرب اضافه کنیم.
خیلی جالب است، اما با این همه ترافیک، تشخیص اینکه چه کسی میآید و چه کسی میرود سخت است. ما یک گرادیان به مسیرها اضافه کردیم تا نقطهها وقتی حالت را ترک میکنند آبی و وقتی میرسند نارنجی به نظر میرسند.
بیایید صادق باشیم، این به نظر یک دسته مورچه ها نسبتاً سازمان یافته است. اما این یک گروه جذاب است که مردم می توانند با آن همذات پنداری کنند. آیا ایده ای به ما می دهد؟ خوب، نه آنهایی که در ابتدا برای آنها کار می کردیم. هیچ راه آسانی برای مقایسه سال ها وجود ندارد، هیچ حساب روشنی از ورودی ها و خروجی ها وجود ندارد. اگر میخواهیم دادهها را معنا کنیم و نتیجهگیری ملموسی بگیریم… ابزارهای دیگر ممکن است مؤثرتر باشند.
اما این یک نمای کلی جذاب از مهاجرت است. این حرکت مداوم و رایج در سراسر کشور را نشان می دهد و برخی از جریان های حجم بالاتر را در هر دو جهت برجسته می کند. شما را جذب می کند و به شما چشم اندازی می دهد که به راحتی در مجموعه ای از نمودارهای میله ای در دسترس نیست. بنابراین ما با هر دو تعامل برقرار کردیم.
هر نقطه نشان دهنده 1000 نفر است و مهاجرت برای سال در 10 ثانیه اتفاق می افتد. یا اگر ترجیح می دهید، هر نقطه می تواند نشان دهنده 1 نفر باشد و شما می توانید سال را در کمتر از 2 ساعت و 45 دقیقه تماشا کنید. اگر روی دسکتاپ هستید، میتوانید با آن تعامل کنید تا جریان یک وضعیت را ببینید. و البته برای موبایل و شبکه های اجتماعی گیف متحرک اجباری را ساختیم.
و درست زمانی که فکر میکردیم کارمان تمام شده است، دادههای جدیدی منتشر شد و ما موظف شدیم موارد را برای سال 2015 بهروزرسانی کنیم.
ساختن تصویری که هم واضح و هم جذاب باشد کار سختی است. در واقع، گاهی اوقات اصلا کار نمی کند. در این پست، ما فقط برخی از مراحلی که برداشته ایم را برجسته کرده ایم. ما همچنین به تنظیمات الگوریتم، رنگ، شفافیت و تعامل پرداختیم. ما نسخه هایی را با مهاجرت خالص آزمایش کردیم. ما سعی کردیم که choropleths را همپوشانی کنیم و مهاجرت را با متغیرهای دیگری مانند بیکاری و نرخ تولد مقایسه کنیم. هیچ یک از این تکرارها حتی به این پست وبلاگ نرسید.
تجسم شهودی، جذاب و بصیرتی دقیقاً به دلیل تلاش بسیار نادر است. ما همچنان معتقدیم که تلاش ارزشش را دارد.