محورهای پژوهشی: پژوهش‌های فناورانه و کاربردی

علوم داده درحوزه زیست پزشکی شامل تجزیه و تحلیل مجموعه داده‌های زیست پزشکی در مقیاس بزرگ برای درک نحوه عملکرد سیستم‌های زنده می‌باشد. بسیاری از بیماری‌های انسان تحت تأثیر ترکیب پیچیده‌ای از عوامل ژنتیکی، محیطی و شیوه زندگی انسان‌ها قرار دارند. لذا علوم داده ‌در حوزه سلامت می‌تواند برای درک بهتر و پیشگیری از این بیماری‌های پیچیده با جمع‌آوری، تجزیه و تحلیل داده‌های چند مقیاسی، اطلاعات بالینی عملی برای پزشکان و بیماران ایجاد کند.
دسترسی روزافزون به داده‌های الکترونیکی سوابق سلامت، امکان بررسی داده‌ محور را در مورد مسائل مراقبت‌های بهداشتی معاصر فراهم کرده است. علوم داده به ما کمک می‌کند تا با توسعه روش‌های علم داده نوآورانه، یادگیری ماشینی و مدل‌سازی سلامت دیجیتال، داده‌های زیست ‌پزشکی چندمقیاسی (مانند DNA و دیگر omicها، تصویربرداری، حسگرهای پوشیدنی و داده‌های سوابق سلامت الکترونیکی) را به اطلاعات سلامت عملی تبدیل کنیم.

یکی از مهمترین حوزه‌های علم داده در حوزه سلامت، ژنومیک یا زیست‌شناسی مصنوعی می‌باشد. از آنجایی که ژنومیک انقلابی در اکتشافات پزشکی رقم می‌زند، درکی بهتر از ژنوم و توانایی استفاده از مجموعه داده‌های ژنومی ضروری است. علم داده‌های ژنومی، زمینه‌ای است که محققان را قادر به استفاده از روش‌های محاسباتی و آماری قدرتمند برای رمزگشایی اطلاعات عملکردی پنهان در توالی DNAها می‌سازد. ابزارهای علم داده که در زمینه پزشکی ژنومیک به کار می‌روند، به محققان و پزشکان کمک می‌کنند تا چگونگی تأثیر تفاوت در DNA بر سلامت و بیماری انسان را کشف کنند. حوزه تجهیزات الکترونیکی پوشیدنی هم در سال‌های اخیر توسعه فراوانی یافته و حجم بالای داده‌های آن در سال‌های آینده باعث افزایش نیاز به پردازش داده‌های حجیم و استخراج دانش نوین از ترکیب آن‌ها با داده‌های ژنومیک خواهد بود.

                    

زیست‌شناسی ساختاری

از دیگر شاخه‌های این حوزه می‌توان به کاربرد هوش مصنوعی در زیست‌شناسی ساختاری اشاره کرد. زیست‌شناسی ساختاری شاخه‌ای از علم می‌باشد که به مطالعه پروتئین‌ها و سایر مولکول‌های زیستی از طریق ساختارهای سه بعدی آن‌ها می‌پردازد. اندازه‌گیری و تفسیر ساختارهای زیست مولکولی به صورت سنتی بسیار دشوار و پرهزینه می‌باشد. اما اخیرا نشان داده شده است که با رویکردهای مدل‌سازی مبتنی بر یادگیری ماشین و هوش مصنوعی، پیش‌بینی و درک در مورد ساختارهای زیست مولکولی در مقیاس‌های پروتئوم با وضوح اتمی بی‌سابقه به امری عادی تبدیل می‌شود. این موفقیت سبب تأثیرات دگرگون کننده‌ای بر توانایی ما برای ایجاد داروهای مؤثر، درک مهندسی زیست‌شناسی و طراحی مواد و ماشین‌آلات مولکولی جدید خواهد داشت.

زیست‌شناسی محاسباتی

همچنین می‌توان به زیست‌شناسی محاسباتی در این حوزه اشاره کرد. زیست‌شناسی محاسباتی علم استفاده از داده‌های بیولوژیکی برای توسعه الگوریتم‌ها یا مدل‌ها به منظور درک سیستم  و روابط بیولوژیکی موجودات است. در چند دهه گذشته با گسترش استفاده از هوش مصنوعی در این حوزه، محققان این امکان را دارند تا روش‌های تحلیلی را برای تفسیر مقادیر انبوه اطلاعات بیولوژیکی توسعه دهند و از این الگوریتم‌ها در شناخت روابط بیولوژیکی موجودات استفاده کنند.
از دستاوردهای این حوزه، می‌توان به AlphaFold اشاره کرد. AlphaFold یک برنامه بر مبنا هوش مصنوعی است که توسط تیم Google's DeepMind توسعه یافته است که پیش‌بینی ساختار پروتئین را انجام می‌دهد. پروتئین‌ها اساسا در هر فعالیت مهمی که در داخل بدن هر موجود زنده اتفاق می‌افتد، نقش بسیار مهمی را ایفا می‌کنند. همانند: هضم غذا، فعال کردن ماهیچه‌ها برای انقباض، حرکت اکسیژن در سراسر بدن، حمله به ویروس‌ها و باکتری‌های خارجی. پروتئین‌ها می‌توانند مجموعه وسیعی از ساختارها و عملکردهای مختلف را انجام دهند، به همین دلیل از لحاظ ساختاری باید توانایی تبدیل به ساختارهای پیچیده سه بعدی را داشته باشند لذا تعداد پیکربندی‌های مختلفی که یک پروتئین ممکن است بر اساس توالی اسیدهای آمینه‌اش در آن ایجاد شود، بسیار عدد بزرگی می‌باشد و از نظر تئوری هر پروتئین در حدود 300^10 ساختار مختلف را می‌تواند اتخاذ کند. از این رو، تخمین و تعیین ساختار سه بعدی پروتئین‌ها تا قبل از ظهور AlphaFold امری دست نیافتنی بود و AlphaFold یک انقلاب در زمینه بایولوژی ایجاد کرد. پس از دو سال، نسخه جدیدتر این برنامه به نام AlphaFold2 در سال 2021 توسعه داده شد که بار محاسباتی را نسبت به نسخه قبلی بسیار کاهش داد. دلیل اصلی این امر این می‌باشد که بجای یادگیری جداگانه هر ماژول در مدل، بر اساس مفهوم Attention می‌باشد.
 

   

کاربردهای علوم داده این پتانسیل را دارند که به طور وسیع در صنعت تلکام (مخابرات) مورد بهره‌برداری قرار گیرند. علوم داده به اپراتورهای صنعت مخابرات و تلفن همراه کمک می‌کند که عملکردهای شبکه را بهبود دهند؛ سودآوری را بیشینه نمایند، و استراتژی‌های بازار را به نحوی هوشمندانه طراحی و مدیریت کنند. با افزایش حجم دادگان تبادل شده در بسترهای مخابراتی مختلف، راهکارهای خلاقانه و مبتنی بر داده بیش از پیش مورد نیاز است که علوم داده رکن اساسی آن‌ها خواهد بود.
 

 

علوم داده برای اپراتورهای صنعت تلکام به منظور ارائه سرویس‌های بهتر به مشتریان

تحلیل‌های زمان واقعی یا پیش‌بینی به عنوان سازوکارهایی مبتنی بر علوم داده این پتانسیل را دارند که توسط شرکت‌های حوزه تلکام به کار گرفته شوند تا اطلاعاتی روشنگرانه به دست دهند. این اطلاعات جهت اتخاذ تصمیم‌های خلاقانه و داده-محور از اهمیت بالایی برخوردار خواهند بود. هرچه دانش اپراتورها از نیاز مشتریان و رفتار کاربران ژرفتر باشد، سودآوری بیشتری نیز نصیب اپراتورها خواهد گشت. در زمینه سازوکارها و راهکارهای داده-محور می‌توان به موارد زیر اشاره نمود:
  • دسته‌بندی مشتریان
  • مقابله با سرخوردگی در مشتریان
  • تخمین ارزش حاصل شده در درازمدت برای مشتری
  • موتورهای توصیه‌گر
  • تحلیل احساسات مشتری
  • تحلیل‌های زمان واقعی
  • بهینه‌سازی قیمت

علوم داده برای اپراتورهای صنعت تلکام جهت بهبود عملکرد شبکه

بهینه‌سازی و مدیریت شبکه:
با بهره‌گیری از تکنیک‌های برآمده از علوم داده می‌توان نواحی شلوغ شبکه را شناسایی و سازوکارهای مناسب و هوشمند را جهت بهینه‌سازی ترافیک شبکه اعمال نمود. علوم داده همچنین می‌تواند تشخیص ناهنجاری‌های شبکه را به طرز چشم‌گیری تسهیل نماید و به اپراتورها تضمین‌هایی را مبنی بر اینکه شبکه به صورت ایمن، قابل اطمینان و کارا در حال اجراست، ارائه دهد.

تشخیص تقلب:
براساس تخمین‌های به دست آمده از صنایع مرتبط با تلکام، شرکت‌های این حوزه سالیانه 2.8 درصد از درآمد خود را بر اثر نشت داده و تقلب از دست می‌دهند که منجر به صرف هزینه‌ی سالیانه‌ای بالغ بر 40 میلیارد دلار در سال می‌گردد! صنعت تلکام که روزانه کاربران بیشتر و بیشتری را در شبکه پذیراست، در معرض فعالیت‌های مجرمانه و تهدید کننده‌ای قرار دارد. دسترسی غیرمجاز، دزدی اطلاعات، کاربران دروغین، تشابه‌سازی و رفتارهای متقلبانه از این قبیل‌اند. چنین رفتارهای متقلبانه‌ای به طور مستقیم بر ارتباط حسنه میان اپراتور و مشتریان اثر منفی بر جای می‌گذارد. در نتیجه، مجهز شدن به راهکارهایی هوشمندانه و داده-محور که به مدد علوم داده قابل دستیابی است، برای صنعت تلکام امری حیاتی تلقی می‌شود.
 

هوش مصنوعی در لبه شبکه

در سال‌های اخیر شاهد گسترش تقاضا برای دریافت خدمات مبتنی بر محاسبات مرزی (لبه شبکه) بوده‌ایم. چنانکه در همه‌گیری اخیر بیماری کووید مشاهده گردید، نیاز به تحقق سازوکارها و فرآیندهای تجاری هوشمند، استفاده از بستر اینترنت اشیاء، بهره‌گیری از سرویس‌ها و مزایای مخابرات نسل پنجم و فراتر، و هوش مصنوعی پیاده‌سازی شده در دستگاه‌ها بیش از هر زمان دیگری احساس شد. هوش مرزی، یا به عبارتی دیگر ترکیب هوش مصنوعی با محاسبات مرزی، امروزه نیازی اساسی در صنعت تلکام تلقی می‌شود. به عنوان مثال، بیمارستان‌ها/کلینیک‌ها و شهرهای هوشمند، فروشگاه‌های هوشمند، اتومبیل‌های خودران و غیره در این زمره قرار می‌گیرند. تمامی این کاربردها نیاز مبرم به سرویس‌های مبتنی بر علوم داده دارند که باید به نحوی کارا پیاده شوند.
 

 
نهادهای بخش عمومی و متولیانی که جاده‌ها، بزرگراه‌ها و دیگر شبکه‌های حمل و نقل عمومی را ساخته و راه‌اندازی می‌کنند، نیازی روزافزون به علوم داده در این حوزه‌ها دارند. با تجزیه و تحلیل علوم داده می‌توان بهترین جایگزین را برای رسیدن از یک مبدأ به مقصد پیدا کرد. همچنین می‌توان پیش‌بینی‌هایی در مورد چگونگی بسته شدن خطوط مترو، وقایع ترافیکی پیش‌بینی نشده یا پروژه‌های تعمیر و نگهداری دستگاه‌های حمل و نقل (که می‌توانند بر ترافیک حمل و نقل عمومی تأثیر بگذارند) دریافت کرد.
به طور مثال با کمک علم داده در حوزه حمل و نقل می‌توان وقوع ترافیک، تصادف یا خرابی وسیله نقلیه را شناسایی یا پیش‌بینی کرد و پاسخ‌های کارآمدی پیشنهاد داد که رویکردهای جدیدی برای حل مشکلات ترافیک، بهبود ایمنی حمل و نقل، کارایی سیستم و کیفیت زندگی در جامعه ما عرضه می‌کنند.
 


حوزه‌های اصلی حمل و نقل شامل جاده‌ها، راه‌آهن، راه‌های آبی و راه‌های هوایی است. در زیر به بررسی کاربرد علوم داده در هر یک از این حوزه‌ها می‌پردازیم:
 

مدیریت ایمنی راه

از داده‌ها می‌توان برای تجزیه و تحلیل مکان، چرایی و زمان وقوع حوادث استفاده کرد. با استفاده از این داده‌ها می‌توان نقشه‌های پیش‌بینی حادثه را ایجاد کرد که مناطق پرخطر را مشخص کنند. این نقشه‌ها می‌توانند به صدور هشدارها برای مراقبت بیشتر در این مکان‌ها کمک کنند.

مدیریت ترافیک جاده‌ای

ثبت الگوهای حرکتی خودروها، سرعت و رفتار تغییر مسیر می‌تواند به ما کمک کند تا بفهمیم طراحی‌های مختلف جاده چگونه می‌تواند بر رانندگی تأثیر بگذارد. این بینش برای کنترل ترافیک هوشمندتر و شناسایی تراکم در طرح جاده هنگام برنامه‌ریزی توسعه زیرساختی آینده مفید است.
 

افزایش بهره‌وری، یافتن جایگاه‌های پارکینگ

در شهرهای بزرگ، افرادی که در تلاش برای یافتن جای پارک هستند، 15 تا 30 درصد ترافیک را ایجاد می‌کنند. فناوری‌های جدید مانند دوربین‌ها، حسگرها، ردیابی و تجزیه و تحلیل جغرافیایی می‌توانند به رانندگان کمک کنند تا مکان‌های پارک مناسب را پیدا کنند.
 

مدیریت ترافیک ریلی

برنامه‌های کاربردی در صنعت راه‌آهن شامل رزرو، بهبود امنیت، برنامه‌ریزی خودکار، بهبود شبکه و مدیریت بلیط است. داده‌های موجود که از کنترل عملیات سفر، سیستم رزرواسیون، دوربین مدار بسته و انبارهای نگهداری جمع آوری می‌شود، می‌تواند به ما برای به دست آوردن مزایای تجاری در زمینه‌های فوق کمک کنند.
 

مدیریت ترافیک هوایی

صف‌های طولانی یکی از آزاردهنده‌ترین مشکلات مسافران هوایی است. با کمک علم داده و با استفاده از هوش مصنوعی می‌توان از وقوع این چنین اتفاقاتی جلوگیری کرد. همچنین تجزیه و تحلیل‌های پیشرفته این داده‌ها می‌تواند به کارکنان فرودگاه کمک کند تا به راحتی در شلوغ‌ترین دوره‌ها برای پست‌های بازرسی امنیتی خود بهترین عملکرد را داشته باشند.
 

نظارت بر کشتی و بهینه‌سازی مسیر

نظارت بر کشتی یکی از مهمترین عوامل برای برنامه‌ریزی و اجرای بدون خطا است. ابزارهای مختلفی مانند حسگرهای کشتی، گزارش ایستگاه‌های هواشناسی و گزارش‌های ماهواره‌ای، کارایی کشتی‌ها را افزایش می‌دهند. با استفاده از علوم داده می‌توانیم به سؤالات زیر پاسخ دهیم:
 
  • چه زمانی بدنه را برای صرفه‌جویی در مصرف سوخت باید تمیز کرد؟

  • چه زمانی باید تجهیزات کشتی را تعویض کرد؟

  • بهترین مسیر از نظر آب و هوا، ایمنی و سوخت پایدار کدام مسیر است؟

 

 

رسانه‌های دیجیتال بسیار گسترده است و ماهیت و منابع داده در آن بسیار متنوع است (به عنوان مثال، متن، صدا، تصاویر و ویدئوها در وب سایت‌های خبری و پلتفرم‌های رسانه‌ای اجتماعی). داده‌های مرتبط با رسانه ذاتا وابسته به زمان هستند و اغلب برای بسیاری از سؤالات مورد علاقه (مثلا اعتبار اخبار در سطح مقالات یا ادعاها) داده‌های صحیح مبنا (Ground truth) به اندازه کافی وجود ندارند. تنوع داده‌های رسانه‌ای، سؤالات مهمی را در مورد تعمیم‌پذیری ابزارهای علمی در میان پلتفرم‌ها، زبان‌ها و قالب‌های داده مطرح می‌کند، و جنبه تعاملی رسانه سؤالات عمیقی را در مورد تشخیص علیت ایجاد می‌کند. چالش‌های تحقیقاتی در رسانه‌های دیجیتال از زوایای مختلف مورد بررسی قرار گرفته‌اند، از جمله پردازش زبان طبیعی، علوم شبکه، یادگیری ماشین، آمار، علوم کامپیوتر، علوم اجتماعی و علوم سیاسی. یکی از چالش‌های اصلی علوم داده، پردازش این نوع داده‌ها است. این پردازش شامل مراحلی همچون ذخیره‌سازی، مدیریت، تحلیل و یکپارچه‌سازی داده‌ها، با روشی بهینه است. چالش دیگر تحلیل این داده‌ها مدیریت همزمان داده‌های ساختارمند و بدون ساختار است. داده‌های بدون ساختار معمولا تلفیقی از انواع مختلف داده همچون متن، تصویر و ویدئو هستند که از منابع مختلفی تولید شده‌اند. در ذخیره‌سازی این داده‌ها استفاده از روش‌های عادی به سادگی ممکن نیست و پردازش آن‌ها نیز به روش‌های نوین نیاز دارد.
در این گروه ما امیدواریم که با همکاری محققان، چالش‌های واقعی در دنیای واقعی را تعریف و رسیدگی کنیم.
 


 

علوم داده مالی را می‌توان کاربرد تکنیک‌های علوم داده و هوش مصنوعی در مسائل مالی و بازار تعریف کرد. این حوزه شامل مهارت‌هایی از حوزه‌های متفاوت مانند علوم کامپیوتر، ریاضیات، آمار، تجسم اطلاعات، ارتباطات و تجارت است. رایج‌ترین تکنیک‌های مورد استفاده در حوزه مالی جهت استخراج اطلاعات شامل مدل‌سازی پیش‌بینی، خوشه‌بندی، تجسم و کاهش ابعاد می‌باشد تا بتوان امکانات قوی برای درک داده‌های مالی و حل مشکلات مرتبط را فراهم کند.

از کاربردهای علم داده‌های مالی می‌توان به تحلیل ریسک (Risk Analytics) درسرمایه‌گذاری‌ها، تجزیه و تحلیل و مدیریت داده‌های مشتری‌ها (Customer Data Management & Analytics) در شرکت‌ها، کشف معاملات تقلبی (Fraud Detection)، استخراج الگوریتم‌های تجارت (Algorithmic Trading ) و پیش‌بینی اتفاقات بازار در آینده (Predictive Analytics) اشاره کرد.

بخش مالی از اولین صنایعی می‌باشد که قابلیت‌ سودآوری کلان علم داده را شناسایی کرد. بانک‌ها همواره در حال تلاش برای پیش‌بینی تغییرات بازار برای انجام بهترین سرمایه‌گذاری و کسب مزیت رقابتی بوده‌اند. در همین راستا، تجزیه و تحلیل داده‌ها بهترین راه  برای رسیدن به این تصمیمات را نشان می‌دهد. از طرفی بانک‌ها و سایر مؤسسات مالی به اطلاعات بازار از جمله سنجه‌های بازار و داده‌های تراکنش‌ها و مشخصات دقیق مشتریان دسترسی دارند و می‌توانند نقش مهمی را در این زمینه بازی کنند. با این حال یکی از بزرگترین مشکلات در این حوزه، آن است که چگونه می‌توان از تمام این داده‌های بدون ساختار به نحو کارآمدی استفاده کرد. اینجاست که علم دادگان مالی وارد عمل می‌شود. در این حوزه می‌توان با جمع‌آوری، استخراج، و معنا بخشیدن به داده‌ها و استنباط‌ها، زمینه‌های تصمیم‌گیری‌های مورد نظر را فراهم نمود.

همچنین علوم داده اجتماعی رشته جدیدی است که علوم اجتماعی و علوم داده را ترکیب می‌کند. در این حوزه تجزیه و تحلیل کلان داده‌ها با نظریه و تحلیل علمی اجتماعی مرتبط بررسی می‌شود. مسئله‌ای که در این حوزه وجود دارد آن است که اگرچه می‌توانیم پدیده‌های اجتماعی را توضیح دهیم، اما این توجیه‌ها سال‌ها پس از وقوع آن‌ها رخ می‌دهد. به عبارت دیگر، ما هنوز قادر به «پیش‌بینی» پدیده‌های اجتماعی نیستیم. علوم داده در این راستا می‌تواند کمک کننده باشد.
 

 

مراحل و فرآیندهای مرتبط با اکتشاف، استخراج، پالایش و تولید نفت و گاز حجم زیادی از داده تولید می‌کنند که این مقدار روز به روز با پیشرفت تکنولوژی‌های مرتبط با این صنعت افزایش پیدا می‌کند. به طور متوسط در یک سکوی نفتی، 80000 (هشتاد هزار) سنسور وجود دارد که روزانه بیش از دو ترابایت داده تولید می‌کنند. همچنین طبق آمارها، مهندسان نفت و گاز و زمین شناسان، بیش از نیمی از زمانشان را صرف جست و جو، تجمیع و تحلیل این داده‌ها می‌کنند.

علوم داده، می‌تواند به این صنایع کمک کند تا با تحلیل اتوماتیک و هوشمند این حجم عظیم داده، الگوهای پنهان، ارتباطات و همبستگی‌های جدید و روندهایی را استخراج کنند که تحلیل‌های دقیق و پیش‌بینی‌هایی واقع‌بینانه از آینده را به ارمغان آورد.

برای مثال علوم داده می‌تواند با تحلیل داده‌های به دست آمده از بازرسی‌های ایمنی خطوط انتقال و پالایشگاه‌ها، منجر به تولید و توسعه الگوریتم‌ها و پیش‌بینی‌های تحلیلی برای تشخیص وضعیت ایمنی خطوط شود. به طوری که به صورت هوشمند روندها و بخش‌های خطر آفرین را تشخیص دهد و به صورت آنی بتواند تهدیدهای امنیتی و ایمنی را تشخیص دهد و هشدارهای به موقع صادر کند.

همچنین علوم داده می‌تواند در خودکارسازی و بهینه‌سازی مدیریت و مصرف منابع در صنعت انرژی نقش به سزایی ایفا کند. ارائه پیش‌بینی‌های دقیق از الگوری مصرف انرژی و ارائه تصمیمات پیشنهادی مؤثر برای افزایش بهره‌وری و استفاده بهینه از منابع، برخی از کاربردهای علوم داده در این حوزه هستند. علوم داده و هوش مصنوعی به این صنایع کمک می‌کنند که با گذشتن از محدودیت‌های انسانی در تحلیل، پیش‌بینی و تصمیم‌گیری، فرآیندهای استخراج، فرآوری و تولید را با حداکثر سرعت، کمترین خطا و بیشترین کارایی به انجام برسانند.

تشخیص و پیش‌بینی خطای تجهیزات، امنیت و ایمنی، تحلیل قابلیت اطمینان و پیش‌بینی میزان تقاضا و قیمت، تنها برخی از خدماتی است که هوش مصنوعی می‌تواند در سطح مدیریتی این حوزه ارائه کند.
 

 
چالش‌های امنیت و حریم خصوصی نقش محوری در آینده‌ی "جهان متصل هوشمند" ایفا خواهند کرد. صیانت از حریم خصوصی داده‌های کاربران در شبکه‌های اجتماعی و دستگاه‌های تلفن همراه، تشخیص و مقابله با سرقت شناسه کاربران در تراکنش‌های برخط و دسترسی غیرمجاز به چیپ‌های الکترونیکی اتومبیل‌های خودران برخی از چالش‌های کلیدی هستند که در زمینه سرویس‌های ارائه شده مبتنی بر تکنولوژی‌های علوم داده و علوم کامپیوتر به طور مستقیم کاربران را تحت تأثیر قرار می‌دهند.
 


الگوریتم‌های رمزنگاری و امنیت به طور سنتی با هدف تمرکز بر ارائه راه‌حل‌هایی برای امن کردن سرویس‌های بانکی و مخابرات توسعه یافتند. امروزه، با گسترش شگرف ایجاد شده در زمینه‌های علوم داده طیف وسیعی از کاربردها و سیستم‌ها نیازمند تضمین‌هایی ویژه در زمینه امنیت و حریم خصوصی هستند. اتومبیل‌های خودران، خدمات سلامت دیجیتال، کارخانه‌ها و ساختمان‌های هوشمند برخی از مثال‌ها در این زمینه‌اند.

در حوزه امنیت و حریم خصوصی برای علوم داده نیازمند راه‌حل‌هایی هستیم که در عمل نیز پاسخ‌هایی مناسب به دست دهند. برای نیل به این مقصود لازم است تا شهودی جامع از داده‌های تجربی و رفتاری به دست آید. بنابراین ارائه تضمین‌هایی برای حفظ امنیت و حریم خصوصی در کاربردهای واقعی، به نحوی که بتوانند همگام با روند رو به رشد زیرساخت‌های فناوری اطلاعات حرکت نمایند، بیش از گذشته احساس می‌شود.
 
استفاده از روش‌های مبتنی بر داده‌های تجربی سابقه طولانی در علوم فیزیکی دارد. فیزیک دانان و ستاره شناسان از گذشته تا حال، همواره نقشی فعال در علوم مرتبط با کلان داده داشته‌اند. برخورددهنده‌های پرانرژی، مانند آنچه در سرن (CERN) وجود دارد، حجم عظیمی از داده‌ها را تولید می‌کنند. حجم داده‌های مرکز داده سرن در 29 ژوئن 2017 از مرز 200 پتابایت نیز عبور کرد! در نجوم، تلسکوپ هابل که 30 سال قدمت دارد، روزانه حدود 12 گیگابایت داده جمع‌آوری می‌کند، اما ابزارهای جدیدی مانند تلسکوپ بزرگ سینوپتیک (LSST)، رصدخانه امواج گرانشی تداخل سنج لیزری (LIGO) و تلسکوپ فضایی جمیز وب که به زودی پرتاب می‌شود، در ابعاد پتابایت داده تولید می‌کنند.

با این حال، فیزیک و نجوم تنها علوم فیزیکی نیستند که با داده‌های حجیم سر و کار دارند. مشاهدات دقیق، مداوم و مبتنی بر فناوری‌های روز، همواره به پیشرفت‌های حوزه‌های مرتبط با داده‌های فیزیکی، از جمله ژئوفیزیک و علم هواشناسی کمک شایانی کرده است. زلزله شناسان در دهه 1980 نقشه‌برداری از ساختار داخلی زمین را به صورت سه بعدی آغاز کردند. پیشرفت‌های بعدی مبتنی بر داده توسط داده‌های GPS امکان‌پذیر شد که می‌توانست حرکت فوق‌العاده آهسته صفحات زمین ساختی را که طی میلیون‌ها سال رخ می‌داد، ثبت کند. همچنین نشان داد که چگونه این صفحات در طول سال‌ها تا دهه‌ها تغییر شکل می‌دهند. زلزله شناسان اولین دانشمندانی بودند که داده‌های خود را به صورت عمومی با سایر نقاط جهان به اشتراک گذاشتند!

حوزه علوم شیمی و مواد نیز از جمله زمینه‌های مرتبط با علوم داده فیزیکی است که به کمک روش‌های مبتنی بر داده و استفاده بیشتر از شبیه‌سازی‌های رایانه‌ای برای پیش‌بینی ویژگی‌های فیزیکی و شیمیایی مواد، منجر به روش‌های نوآورانه در شیمی و علم و مهندسی مواد شده است.

از سوی دیگر حوزه اینترنت اشیاء (IOT) که شبکه‌ای از اشیاء فیزیکی را توصیف می‌کند که به اندازه‌گیری و تبادل دادگان مرتبط با محیط فیزیکی در بستر اینترنت می‌پردازند، شاهد پیشرفت چشم‌گیری در سال‌های اخیر بوده است. این شبکه در کاربردهای وسیعی از اشیاء خانگی معمولی گرفته تا ابزارهای صنعتی پیچیده به کار گرفته می‌شوند. شبکه‌های اینترنت اشیاء که هدف غایی آن‌ها بهبود راندمان سیستم‌ها از طریق پایش هوشمند محیط واقعی در قالب فرآیندهای خودکار است، حجم داده بزرگی از اطلاعات فیزیکی را جمع‌آوری می‌نمایند که نیاز به تحلیل مناسب و کارآمد دارند.
 

شبکه‌های یکپارچه فضایی-هوایی-زمینی و شبکه‌های ویژه هوانوردی

با رشد ترافیک هوایی بین قاره‌ای، مفهوم جدید شبکه‌های هوانوردی ad hoc که بر هواپیماهای مسافربری تجاری متکی است، به طور بالقوه قادر به بهبود ارتباطات دریایی مبتنی بر ماهواره از طریق پیوندهای هوا به زمین و هوا به هوا است.
با توجه به اینکه بیش از 70 درصد از سطح زمین توسط اقیانوس‌ها پوشیده شده است، افزایش فعالیت‌های پراکنده در سراسر اقیانوس‌ها تقاضای زیادی برای ارتباطات دریایی ایجاد کرده است. امروزه حمل و نقل به طور عمده به ماهواره‌ها برای پوشش بدون درز متکی است. با این وجود، به دلیل پوشش گسترده یک ماهواره، پهنای باند اختصاص داده شده برای هر کاربر در واقع محدود است. علاوه بر این، تعداد فزاینده‌ای از هواپیماهای مسافربری بین قاره‌ای در بالای اقیانوس وجود دارد که منجر به افزایش تقاضا برای اتصال به اینترنت در پرواز می‌شود. مانند کشتی‌ها، هواپیماها نیز با محدودیت‌های اتصال ماهواره‌ای مشابهی روبرو هستند. بنابراین، مفهوم شبکه ad-hoc هوانوردی برای تشکیل یک شبکه بی‌سیم خود پیکربندی شده از طریق پیوندهای ارتباطی هوا به هوا پیشنهاد شده است. به عبارت دیگر، تصور ترکیبی از ماهواره‌ها و هواپیماها برای تشکیل یک شبکه یکپارچه فضا-هوا-زمین برای پشتیبانی از ارتباطات دریایی آینده، یک الهام از طبیعت است. قابل ذکر است، طراحی و بهینه‌سازی شبکه‌های یکپارچه فضا-هوا-زمین با چالش‌های متعددی مواجه است! برای مثال، یکی از موارد اساسی، طراحی یک پروتکل مسیریابی کارآمد برای ساخت مسیریابی داده‌های ممکن در هر زمان معین با هدف سازگاری با توپولوژی شبکه بسیار پویا است. در چنین برنامه‌هایی، استفاده از ایده‌ها، الگوریتم‌ها و ابزارهای مرتبط با علم داده برای ارائه راه‌حل‌های مبتنی بر داده‌های جدید برای شبکه‌های یکپارچه فضا-هوا-زمین آینده بسیار مورد نیاز است.