داده های عمومی و اینترنت

زمان مطالعه: 10 دقیقه

اینترنت، بستر داده های عمومی است. اگر چه کپی کردن بعضی از داده ها با اختراع ماشین چاپ از صد ها سال پیش بسیار ارزان شد، اما با این حال هم چنان محدود بود و این اینترنت بود که جهشی در انتقال داده ها و تکثیر آن ها ایجاد کرد. علاوه بر آن اینترنت امکان توسعه جمعی را برای ما فراهم کرد که با آن افراد از سرتاسر دنیا می توانند در توسعه یک داده عمومی مشارکت کنند. توسعه جمعی یکی از مهم ترین شیوه های توسعه داده های عمومی است که پایه پروژه های بزرگی مانند ویکی پدیاست. این ها نشان می دهند که اینترنت نقش حیاتی در داده های عمومی دارد و بدون اینترنت (یا مشابه آن) داده های عمومی بسیاری از مزیت هایشان را از دست می دهند.

اما آیا برعکس این رابطه هم وجود دارد؟ داده های عمومی چه تاثیری روی اینترنت گذاشته است؟ آیا داده های عمومی باعث پیشرفت و عادلانه تر شدن اینترنت شده است؟ چرا شرکت های بزرگ و دولت ها قدرت غیر متقارنی در اینترنت دارند و آیا با داده های عمومی می توان جلوی آن را گرفت؟ سلامت و بهبود عملکرد اینترنت، تاثیر مستقیمی روی داده های عمومی دارد و بررسی آن، حتی اگر مربوط به داده های عمومی نباشد، خالی از لطف نیست که در این نوشته، این موضوعات را بررسی می کنیم.

پروتکل اینترنت

پروتکل اینترنت یا IP مجموعه استاندارد هایی است که برای ارتباط بین کامپیوتر ها به کار گرفته می شود و شبکه اینترنت از این پروتکل استفاده می کند. پروتکل اینترنت کاملا بر پایه داده های عمومی است و هر کسی می تواند دستگاه هایی بسازد که از این پروتکل پشتیبانی کند و برای این کار هیچ محدودیت قانونی یا فنی در مقابل او نیست. شما می توانید مستندات پروتکل اینترنت را از اینترنت دریافت کنید و آن را پیاده سازی کنید.

پروتکل اینترنت یک پروتکل سطح پایین است و نباید آن را با چیز هایی که اضافه بر آن تعریف می شود اشتباه گرفت. به ویژه وب جهان گستر بعضا هم معنی با اینترنت در نظر گرفته می شود که صحیح نیست. اینترنت یک شبکه سطح پایین است که کاربرد های متنوعی دارد و وب یکی از این کاربرد هاست. وب یک مجموعه استاندارد است که توسط w3c تعیین می شود و به کمک آن استاندارد ها می توانید محتوا را از طریق پروتکل اینترنت دریافت کنید و به کمک مرورگر وب ببینید.

پروتکل اینترنت و بسیاری از خدمات مبتنی بر آن مثل وب، ایمیل، ... استاندارد هایی عمومی هستند و همین موضوع به گسترش برابر اینترنت کمک کرده است.

شبکه اینترنت

اما پروتکل به تنهایی چیزی نیست که امروزه به آن اینترنت می گوییم، بلکه منظور از اینترنت عموما شبکه اینترنت است. شبکه اینترنت یک شبکه مفصل از میلیارد ها کامپیوتر است که با پیاده سازی پروتکل اینترنت به هم متصل شده اند.

برخلاف پروتکل اینترنت که یک داده بود و چون داده عمومی بود از مزایای آن بهره مند بود، شبکه اینترنت یک داده نیست. جدای از دستگاه هایی که در آن مشارکت دارند که اگر آن ها را یک ماشین واحد در نظر بگیریم بزرگترین ساخته بشر است و بیش از چهار درصد از برق جهان را مصرف می کند که به وضوح داده نیست، اینترنت یک قرارداد بزرگ هم هست که مردم جهان در آن توافق کرده اند تا با شرایطی عضوی از این شبکه باشند. در صورتی که می توانستند توافق کنند به جای اینترنت عضوی از اکبرنت یا فلان نت یا یک شبکه دیگر باشند. حتی ممکن است روزی مردم اینترنت را کنار بگذارند و به جای آن به مثلا اکبرنت بپیوندند.

پس شبکه اینترنت یک داده نیست و در نتیجه .حل مشکلاتش تحت پوشش داده های عمومی نیست در این جا سوال پیش می آید که مگر شبکه اینترنت چه مشکلاتی دارد؟ که ذر ادامه به آن اشاره خواهیم کرد.

مشکلات اینترنت

  • اینترنت هزینه دارد: اگر اینترنت داده بود، می توانستیم بی نهایت نسخه از آن را کپی کنیم و به همه بی نهایت نسخه از آن را بدهیم. اما این گونه نیست. این هزینه از دو جا ناشی می شود. اول این که استفاده از اینترنت برق قابل توجهی مصرف می کند. هر گیگابایت دانلود از اینترنت چندین کیلووات ساعت برق مصرف می کند که تولید این برق بدون هزینه نیست. علاوه بر هزینه ماده ای اینترنت، ساختار اینترنت باعث می شود که لایه های بالاتر بسته به شرایط جغرافیایی در ارائه اینترنت انحصار داشته باشند و بتوانند هر قیمتی که می خواهند را به لایه های پایین تر تحمیل کنند.

  • برای وصل شدن به اینترنت باید اجازه بگیرید: برای وصل شدن به اینترنت، شما باید یک آدرس داشته باشید که همه جهان روی آن توافق داشته باشند که این آدرس شما هستید. در ساختار فعلی اینترنت، هر کس باید این آدرس را از یک لایه بالاتر خود بگیرد و این لایه بالاتر می تواند به هر دلیلی از فراهم کردن این اتصال خودداری کند. هم چنین تمام ارتباط شما به اینترنت از لایه های بالاتر می گذرند که هر کدام می تواند به طور گزینشی بعضی از بسته های شما را ارسال نکند.

  • حریم خصوصی در اینترنت ضعیف است: از روی نشانی اینترنتی شما، تقریبا معلوم می شوید و افراد بسیاری این توانایی را دارند که شما را در اینترنت رهگیری کنند و سر از کار شما در بیاورند. هم چنین بعضی از سرویس های اینترنتی اطلاعات را به صورت رمز نشده انتقال می دهند و همه افراد میانی می توانند به آن دسترسی داشته باشند. حریم خصوصی از این جهت اهمیت ویژه دارد که شرکت های بزرگ با جمع آوری این داده ها در مقیاس بزرگ به توانایی های عجیبی مثل پیش بینی و هدایت جامعه دست پیدا می کنند که به هیچ وجه نباید این قابلیت ها در دسترس شرکت های سرمایه محور و بازیگران بد باشد.

ساختار اینترنت

همانطور که اشاره شد، عمده مشکلات اینترنت ریشه در ساختار اینترنت دارد. اما این ساختار دقیقا چیست و چرا این مشکلات را دارد؟

در لایه پایینی، این ساختار تقریبا مشابه ساختار شبکه تلفن جهانی یا PSTN است. هر کشور به یک بازه از آدرس های آی پی (مثل یک پیش شماره تلفن) دسترسی دارد و این آدرس ها را به شرکت های ارائه کننده خدمات اینترنت یا ISP تخصیص می دهد و شرکت ها در یک ساختار چند لایه ای، اتصال شرکت های کوچکتر و در نهایت اتصال کاربران را فراهم می کنند. پس یک کاربر برای اتصال به شبکه در نهایت باید از یکی از دولت ها اینترنت بگیرد. بین دولت ها روابط غیر متمرکزی وجود دارد و دو دولت (عموما همسایه) بین خودشان تصمیم می گیرند که چه حجم ترافیکی را با چه شرایطی انتقال دهند. البته این روابط غیر متمرکز تابع ملاحظات قدرت است و مثلا کشوری که ترافیک ورودی زیادی دارد از بقیه کشور ها شرایط بهتری دارد.

در لایه های بالاتر، شرایط بدتر است. نود و پنج درصد ترافیک اینترنت به سرور های GMAFIA (Google, Microsoft, Amazon, Facebook, IBM, Apple) می رود که یعنی این شرکت های غول پیکر، عملا کنترل اینترنت را در اختیار گرفته اند. در حالی که در روز های اول اینترنت، ارتباط مستقیم انجام می شد یعنی مثلا شما از شرکت تان به یک شخص در یک دانشگاه ایمیل می زدید و ایمیل مستقیم از کامپیوتر شرکت به کامپیوتر دانشگاه می رفت. این شرکت ها می توانند از این قدرت سو استفاده کنند (و می کنند) و حتی با استفاده از خود این سلطه، آن را افزایش دهند و به صورت مرکب رشد کنند. مثلا گوگل می تواند سایت هایی را که از دستوراتش تبعیت نمی کنند در جستجو پایین تر نمایش دهد، آمازون می تواند آن ها را از خدمات ابری اش منع کند و ...

راهکار ها

اینترنت، بستر داده های عمومی است و باید از این بستر محافظت کرد تا یک بستر سالم و مفید و در دسترس همه باشد. داده های عمومی خوبی وجود دارند که می توانند از این بستر بسیار مهم داده های عمومی محافظت کنند. همه راهکار های مطرح شده در زیر داده عمومی هستند و هر کسی می تواند از آن ها استفاده کند.

فناوری ها و استاندارد های رمزنگاری

به طور عادی در اینترنت، هیچ چیز رمز نمی شود و همه افراد میانی (از آی اس پی شما تا دولت شما تا دولت مقصد و دیتاسنتری که سرور مقصد در آن قرار دارد) می توانند همه ترافیک را ببینند. این موضوع علاوه بر این که از نظر امنیت خطرناک است (مثلا همه می توانند رمز ورود شما را ببینند) از لحاظ حریم خصوصی نیز جالب نیست.

خوشبختانه داده های عمومی مربوط به رمزنگاری پیشرفت زیادی کرده اند. صفحات وب با پروتکل https از سرور تا مرورگر شما رمز می شوند. در جایی که سرور خودش هم یک فرد میانی است (مثل پیام رسان ها یا سرویس های ذخیره فایل) الگوریتم های رمزنگاری سرتاسر می توانند دست سرور را نیز از داده های کاربران کوتاه کنند.

البته وجود الگوریتم به تنهایی کافی نیست. مثلا شرکت های بزرگ مثل آمازون یا کلاودفلیر با ارائه خدمات به سرور ها، به پروانه ssl آن ها دست پیدا می کنند و می توانند اطلاعات کاربران این سرور ها را ببینند. یا پیام رسان های انحصاری از ارائه رمزنگاری سرتاسر برای پیام های عادی خودداری می کنند (مثل تلگرام) یا آن را به طوری پیاده کرده اند که متخصصین مستقل نمی توانند صحت پیاده سازی آن را تایید کنند و احتمالا در آن ها در پشتی وجود دارد (مثل واتسپ) و در نتیجه علاوه بر این که این پروتکل ها باید پیشرفت کنند، ما نیز باید از آن ها استفاده کنیم وگرنه فایده ای ندارند.

پروتکل های غیرمتمرکز

اینترنت در ابتدا غیر متمرکز بوده است و پروتکل هایی مثل ایمیل و وب که هنوز نیز به وفور استفاده می شوند، یا تلنت و دیگر پروتکل هایی که الان منسوخ شده اند همه غیر متمرکز بودند و کاربران در عین این که می توانستند کنترل را در دست خودشان بگیرند، می توانستند با بقیه نیز ارتباط داشته باشند. این برخلاف بستری مثل اینستاگرام است که کاربران برای ارتباط با یکدیگر باید توسط شخص سوم (در اینجا شرکت فیسبوک) به این امکان دست پیدا کنند. علاوه بر پروتکل های ابتدایی اینترنت، پروتکل های جدید غیر متمرکزی هم ساخته شده اند و می شوند، برای مثال پروتکل ماتریس برای پیام رسانی در لحظه و پروتکل اکتیویتی پاب برای شبکه های اجتماعی غیر متمرکز از جمله این پروتکل ها هستند.

البته باید توجه کرد که غیرمتمرکز بودن پروتکل، لزوما به غیرمتمرکز بودن شبکه منجر نمی شود. مثلا گوگل کسر بزرگی از کاربران ایمیل را در اختیار دارد و با این سهم بازارش می تواند برای پروتکل مشکل ایجاد کند؛ مثلا گوگل ایمیل هایی را که از منبعی که گوگل نمی پسندد ارسال می شوند را در پوشه اسپم قرار می دهد یا کلا مسدود می کند. پس پروتکل غیرمتمرکز لازم است اما کافی نیست و باید علاوه بر آن، هر کسی از زیرساخت خودش یا یک زیرساخت کوچک استفاده کند تا شبکه واقعا غیر متمرکز شود.

پروژه تور

پروژه تور یک پروژه است که با کمک آن می توانید در اینترنت ناشناس بمانید و ردگیری نشوید. مثل حریم خصوصی، شرکت های بزرگ از ردگیری کاربران برای جمع آوری داده های بزرگ، هدف گیری تبلیغات و به طور کلی، تبدیل شدن به غول های بزرگ تر و خطرناک تر استفاده می کنند.

پروژه تور یک شبکه غیرمتمرکز از داوطلبین است که پهنای باند خود را اهدا می کنند. هر بسته، از چند داوطلب عبور می کند و تنها در صورت همکاری تمام داوطلبین می توان این بسته را ردگیری کرد که یعنی در حالت طبیعی بسته ها به صورت ناشناس می مانند.

ایگدراسیل

ایگدراسیل (و پروژه های مشابه) یک تغییر بنیادین در ساختار اینترنت هستند. در ایگدراسیل مسیریابی به جای روتر های دستی و تاسیسات درختی، توسط یک درخت پوشای جهانی و کاملا خودکار انجام می شود. ایگدراسیل (و پروژه های مشابه) می توانند شبکه های مش خودگردان را به اینترنت وصل کنند. همان طور که چراغ های جلوی هر خانه باعث می شود تا همه خیابان ها روشن شوند وای فای هر خانه نیز می تواند با وصل شدن به همسایه ها یک شبکه مش عظیم بسازد و با الگوریتم های مسیریابی خودگردان مثل ایگدراسیل، همه خانه ها به اینترنت وصل شوند.