گروه سیستمهای اطلاعات و علوم داده
محورهای پژوهشی: پژوهشهای فناورانه و کاربردی
علوم داده درحوزه زیست پزشکی شامل تجزیه و تحلیل مجموعه دادههای زیست پزشکی در مقیاس بزرگ برای درک نحوه عملکرد سیستمهای زنده میباشد. بسیاری از بیماریهای انسان تحت تأثیر ترکیب پیچیدهای از عوامل ژنتیکی، محیطی و شیوه زندگی انسانها قرار دارند. لذا علوم داده در حوزه سلامت میتواند برای درک بهتر و پیشگیری از این بیماریهای پیچیده با جمعآوری، تجزیه و تحلیل دادههای چند مقیاسی، اطلاعات بالینی عملی برای پزشکان و بیماران ایجاد کند.
دسترسی روزافزون به دادههای الکترونیکی سوابق سلامت، امکان بررسی داده محور را در مورد مسائل مراقبتهای بهداشتی معاصر فراهم کرده است. علوم داده به ما کمک میکند تا با توسعه روشهای علم داده نوآورانه، یادگیری ماشینی و مدلسازی سلامت دیجیتال، دادههای زیست پزشکی چندمقیاسی (مانند DNA و دیگر omicها، تصویربرداری، حسگرهای پوشیدنی و دادههای سوابق سلامت الکترونیکی) را به اطلاعات سلامت عملی تبدیل کنیم.
یکی از مهمترین حوزههای علم داده در حوزه سلامت، ژنومیک یا زیستشناسی مصنوعی میباشد. از آنجایی که ژنومیک انقلابی در اکتشافات پزشکی رقم میزند، درکی بهتر از ژنوم و توانایی استفاده از مجموعه دادههای ژنومی ضروری است. علم دادههای ژنومی، زمینهای است که محققان را قادر به استفاده از روشهای محاسباتی و آماری قدرتمند برای رمزگشایی اطلاعات عملکردی پنهان در توالی DNAها میسازد. ابزارهای علم داده که در زمینه پزشکی ژنومیک به کار میروند، به محققان و پزشکان کمک میکنند تا چگونگی تأثیر تفاوت در DNA بر سلامت و بیماری انسان را کشف کنند. حوزه تجهیزات الکترونیکی پوشیدنی هم در سالهای اخیر توسعه فراوانی یافته و حجم بالای دادههای آن در سالهای آینده باعث افزایش نیاز به پردازش دادههای حجیم و استخراج دانش نوین از ترکیب آنها با دادههای ژنومیک خواهد بود.
زیستشناسی ساختاری
از دیگر شاخههای این حوزه میتوان به کاربرد هوش مصنوعی در زیستشناسی ساختاری اشاره کرد. زیستشناسی ساختاری شاخهای از علم میباشد که به مطالعه پروتئینها و سایر مولکولهای زیستی از طریق ساختارهای سه بعدی آنها میپردازد. اندازهگیری و تفسیر ساختارهای زیست مولکولی به صورت سنتی بسیار دشوار و پرهزینه میباشد. اما اخیرا نشان داده شده است که با رویکردهای مدلسازی مبتنی بر یادگیری ماشین و هوش مصنوعی، پیشبینی و درک در مورد ساختارهای زیست مولکولی در مقیاسهای پروتئوم با وضوح اتمی بیسابقه به امری عادی تبدیل میشود. این موفقیت سبب تأثیرات دگرگون کنندهای بر توانایی ما برای ایجاد داروهای مؤثر، درک مهندسی زیستشناسی و طراحی مواد و ماشینآلات مولکولی جدید خواهد داشت.
زیستشناسی محاسباتی
همچنین میتوان به زیستشناسی محاسباتی در این حوزه اشاره کرد. زیستشناسی محاسباتی علم استفاده از دادههای بیولوژیکی برای توسعه الگوریتمها یا مدلها به منظور درک سیستم و روابط بیولوژیکی موجودات است. در چند دهه گذشته با گسترش استفاده از هوش مصنوعی در این حوزه، محققان این امکان را دارند تا روشهای تحلیلی را برای تفسیر مقادیر انبوه اطلاعات بیولوژیکی توسعه دهند و از این الگوریتمها در شناخت روابط بیولوژیکی موجودات استفاده کنند.
از دستاوردهای این حوزه، میتوان به AlphaFold اشاره کرد. AlphaFold یک برنامه بر مبنا هوش مصنوعی است که توسط تیم Google's DeepMind توسعه یافته است که پیشبینی ساختار پروتئین را انجام میدهد. پروتئینها اساسا در هر فعالیت مهمی که در داخل بدن هر موجود زنده اتفاق میافتد، نقش بسیار مهمی را ایفا میکنند. همانند: هضم غذا، فعال کردن ماهیچهها برای انقباض، حرکت اکسیژن در سراسر بدن، حمله به ویروسها و باکتریهای خارجی. پروتئینها میتوانند مجموعه وسیعی از ساختارها و عملکردهای مختلف را انجام دهند، به همین دلیل از لحاظ ساختاری باید توانایی تبدیل به ساختارهای پیچیده سه بعدی را داشته باشند لذا تعداد پیکربندیهای مختلفی که یک پروتئین ممکن است بر اساس توالی اسیدهای آمینهاش در آن ایجاد شود، بسیار عدد بزرگی میباشد و از نظر تئوری هر پروتئین در حدود 300^10 ساختار مختلف را میتواند اتخاذ کند. از این رو، تخمین و تعیین ساختار سه بعدی پروتئینها تا قبل از ظهور AlphaFold امری دست نیافتنی بود و AlphaFold یک انقلاب در زمینه بایولوژی ایجاد کرد. پس از دو سال، نسخه جدیدتر این برنامه به نام AlphaFold2 در سال 2021 توسعه داده شد که بار محاسباتی را نسبت به نسخه قبلی بسیار کاهش داد. دلیل اصلی این امر این میباشد که بجای یادگیری جداگانه هر ماژول در مدل، بر اساس مفهوم Attention میباشد.
علوم داده برای اپراتورهای صنعت تلکام به منظور ارائه سرویسهای بهتر به مشتریان
- دستهبندی مشتریان
- مقابله با سرخوردگی در مشتریان
- تخمین ارزش حاصل شده در درازمدت برای مشتری
- موتورهای توصیهگر
- تحلیل احساسات مشتری
- تحلیلهای زمان واقعی
- بهینهسازی قیمت
علوم داده برای اپراتورهای صنعت تلکام جهت بهبود عملکرد شبکه
بهینهسازی و مدیریت شبکه:تشخیص تقلب:
هوش مصنوعی در لبه شبکه
به طور مثال با کمک علم داده در حوزه حمل و نقل میتوان وقوع ترافیک، تصادف یا خرابی وسیله نقلیه را شناسایی یا پیشبینی کرد و پاسخهای کارآمدی پیشنهاد داد که رویکردهای جدیدی برای حل مشکلات ترافیک، بهبود ایمنی حمل و نقل، کارایی سیستم و کیفیت زندگی در جامعه ما عرضه میکنند.
حوزههای اصلی حمل و نقل شامل جادهها، راهآهن، راههای آبی و راههای هوایی است. در زیر به بررسی کاربرد علوم داده در هر یک از این حوزهها میپردازیم:
مدیریت ایمنی راه
از دادهها میتوان برای تجزیه و تحلیل مکان، چرایی و زمان وقوع حوادث استفاده کرد. با استفاده از این دادهها میتوان نقشههای پیشبینی حادثه را ایجاد کرد که مناطق پرخطر را مشخص کنند. این نقشهها میتوانند به صدور هشدارها برای مراقبت بیشتر در این مکانها کمک کنند.
مدیریت ترافیک جادهای
افزایش بهرهوری، یافتن جایگاههای پارکینگ
مدیریت ترافیک ریلی
مدیریت ترافیک هوایی
نظارت بر کشتی و بهینهسازی مسیر
-
چه زمانی بدنه را برای صرفهجویی در مصرف سوخت باید تمیز کرد؟
-
چه زمانی باید تجهیزات کشتی را تعویض کرد؟
-
بهترین مسیر از نظر آب و هوا، ایمنی و سوخت پایدار کدام مسیر است؟
رسانههای دیجیتال بسیار گسترده است و ماهیت و منابع داده در آن بسیار متنوع است (به عنوان مثال، متن، صدا، تصاویر و ویدئوها در وب سایتهای خبری و پلتفرمهای رسانهای اجتماعی). دادههای مرتبط با رسانه ذاتا وابسته به زمان هستند و اغلب برای بسیاری از سؤالات مورد علاقه (مثلا اعتبار اخبار در سطح مقالات یا ادعاها) دادههای صحیح مبنا (Ground truth) به اندازه کافی وجود ندارند. تنوع دادههای رسانهای، سؤالات مهمی را در مورد تعمیمپذیری ابزارهای علمی در میان پلتفرمها، زبانها و قالبهای داده مطرح میکند، و جنبه تعاملی رسانه سؤالات عمیقی را در مورد تشخیص علیت ایجاد میکند. چالشهای تحقیقاتی در رسانههای دیجیتال از زوایای مختلف مورد بررسی قرار گرفتهاند، از جمله پردازش زبان طبیعی، علوم شبکه، یادگیری ماشین، آمار، علوم کامپیوتر، علوم اجتماعی و علوم سیاسی. یکی از چالشهای اصلی علوم داده، پردازش این نوع دادهها است. این پردازش شامل مراحلی همچون ذخیرهسازی، مدیریت، تحلیل و یکپارچهسازی دادهها، با روشی بهینه است. چالش دیگر تحلیل این دادهها مدیریت همزمان دادههای ساختارمند و بدون ساختار است. دادههای بدون ساختار معمولا تلفیقی از انواع مختلف داده همچون متن، تصویر و ویدئو هستند که از منابع مختلفی تولید شدهاند. در ذخیرهسازی این دادهها استفاده از روشهای عادی به سادگی ممکن نیست و پردازش آنها نیز به روشهای نوین نیاز دارد.
در این گروه ما امیدواریم که با همکاری محققان، چالشهای واقعی در دنیای واقعی را تعریف و رسیدگی کنیم.
علوم داده مالی را میتوان کاربرد تکنیکهای علوم داده و هوش مصنوعی در مسائل مالی و بازار تعریف کرد. این حوزه شامل مهارتهایی از حوزههای متفاوت مانند علوم کامپیوتر، ریاضیات، آمار، تجسم اطلاعات، ارتباطات و تجارت است. رایجترین تکنیکهای مورد استفاده در حوزه مالی جهت استخراج اطلاعات شامل مدلسازی پیشبینی، خوشهبندی، تجسم و کاهش ابعاد میباشد تا بتوان امکانات قوی برای درک دادههای مالی و حل مشکلات مرتبط را فراهم کند.
از کاربردهای علم دادههای مالی میتوان به تحلیل ریسک (Risk Analytics) درسرمایهگذاریها، تجزیه و تحلیل و مدیریت دادههای مشتریها (Customer Data Management & Analytics) در شرکتها، کشف معاملات تقلبی (Fraud Detection)، استخراج الگوریتمهای تجارت (Algorithmic Trading ) و پیشبینی اتفاقات بازار در آینده (Predictive Analytics) اشاره کرد.
بخش مالی از اولین صنایعی میباشد که قابلیت سودآوری کلان علم داده را شناسایی کرد. بانکها همواره در حال تلاش برای پیشبینی تغییرات بازار برای انجام بهترین سرمایهگذاری و کسب مزیت رقابتی بودهاند. در همین راستا، تجزیه و تحلیل دادهها بهترین راه برای رسیدن به این تصمیمات را نشان میدهد. از طرفی بانکها و سایر مؤسسات مالی به اطلاعات بازار از جمله سنجههای بازار و دادههای تراکنشها و مشخصات دقیق مشتریان دسترسی دارند و میتوانند نقش مهمی را در این زمینه بازی کنند. با این حال یکی از بزرگترین مشکلات در این حوزه، آن است که چگونه میتوان از تمام این دادههای بدون ساختار به نحو کارآمدی استفاده کرد. اینجاست که علم دادگان مالی وارد عمل میشود. در این حوزه میتوان با جمعآوری، استخراج، و معنا بخشیدن به دادهها و استنباطها، زمینههای تصمیمگیریهای مورد نظر را فراهم نمود.
همچنین علوم داده اجتماعی رشته جدیدی است که علوم اجتماعی و علوم داده را ترکیب میکند. در این حوزه تجزیه و تحلیل کلان دادهها با نظریه و تحلیل علمی اجتماعی مرتبط بررسی میشود. مسئلهای که در این حوزه وجود دارد آن است که اگرچه میتوانیم پدیدههای اجتماعی را توضیح دهیم، اما این توجیهها سالها پس از وقوع آنها رخ میدهد. به عبارت دیگر، ما هنوز قادر به «پیشبینی» پدیدههای اجتماعی نیستیم. علوم داده در این راستا میتواند کمک کننده باشد.
علوم داده، میتواند به این صنایع کمک کند تا با تحلیل اتوماتیک و هوشمند این حجم عظیم داده، الگوهای پنهان، ارتباطات و همبستگیهای جدید و روندهایی را استخراج کنند که تحلیلهای دقیق و پیشبینیهایی واقعبینانه از آینده را به ارمغان آورد.
برای مثال علوم داده میتواند با تحلیل دادههای به دست آمده از بازرسیهای ایمنی خطوط انتقال و پالایشگاهها، منجر به تولید و توسعه الگوریتمها و پیشبینیهای تحلیلی برای تشخیص وضعیت ایمنی خطوط شود. به طوری که به صورت هوشمند روندها و بخشهای خطر آفرین را تشخیص دهد و به صورت آنی بتواند تهدیدهای امنیتی و ایمنی را تشخیص دهد و هشدارهای به موقع صادر کند.
همچنین علوم داده میتواند در خودکارسازی و بهینهسازی مدیریت و مصرف منابع در صنعت انرژی نقش به سزایی ایفا کند. ارائه پیشبینیهای دقیق از الگوری مصرف انرژی و ارائه تصمیمات پیشنهادی مؤثر برای افزایش بهرهوری و استفاده بهینه از منابع، برخی از کاربردهای علوم داده در این حوزه هستند. علوم داده و هوش مصنوعی به این صنایع کمک میکنند که با گذشتن از محدودیتهای انسانی در تحلیل، پیشبینی و تصمیمگیری، فرآیندهای استخراج، فرآوری و تولید را با حداکثر سرعت، کمترین خطا و بیشترین کارایی به انجام برسانند.
تشخیص و پیشبینی خطای تجهیزات، امنیت و ایمنی، تحلیل قابلیت اطمینان و پیشبینی میزان تقاضا و قیمت، تنها برخی از خدماتی است که هوش مصنوعی میتواند در سطح مدیریتی این حوزه ارائه کند.
الگوریتمهای رمزنگاری و امنیت به طور سنتی با هدف تمرکز بر ارائه راهحلهایی برای امن کردن سرویسهای بانکی و مخابرات توسعه یافتند. امروزه، با گسترش شگرف ایجاد شده در زمینههای علوم داده طیف وسیعی از کاربردها و سیستمها نیازمند تضمینهایی ویژه در زمینه امنیت و حریم خصوصی هستند. اتومبیلهای خودران، خدمات سلامت دیجیتال، کارخانهها و ساختمانهای هوشمند برخی از مثالها در این زمینهاند.
در حوزه امنیت و حریم خصوصی برای علوم داده نیازمند راهحلهایی هستیم که در عمل نیز پاسخهایی مناسب به دست دهند. برای نیل به این مقصود لازم است تا شهودی جامع از دادههای تجربی و رفتاری به دست آید. بنابراین ارائه تضمینهایی برای حفظ امنیت و حریم خصوصی در کاربردهای واقعی، به نحوی که بتوانند همگام با روند رو به رشد زیرساختهای فناوری اطلاعات حرکت نمایند، بیش از گذشته احساس میشود.
با این حال، فیزیک و نجوم تنها علوم فیزیکی نیستند که با دادههای حجیم سر و کار دارند. مشاهدات دقیق، مداوم و مبتنی بر فناوریهای روز، همواره به پیشرفتهای حوزههای مرتبط با دادههای فیزیکی، از جمله ژئوفیزیک و علم هواشناسی کمک شایانی کرده است. زلزله شناسان در دهه 1980 نقشهبرداری از ساختار داخلی زمین را به صورت سه بعدی آغاز کردند. پیشرفتهای بعدی مبتنی بر داده توسط دادههای GPS امکانپذیر شد که میتوانست حرکت فوقالعاده آهسته صفحات زمین ساختی را که طی میلیونها سال رخ میداد، ثبت کند. همچنین نشان داد که چگونه این صفحات در طول سالها تا دههها تغییر شکل میدهند. زلزله شناسان اولین دانشمندانی بودند که دادههای خود را به صورت عمومی با سایر نقاط جهان به اشتراک گذاشتند!
حوزه علوم شیمی و مواد نیز از جمله زمینههای مرتبط با علوم داده فیزیکی است که به کمک روشهای مبتنی بر داده و استفاده بیشتر از شبیهسازیهای رایانهای برای پیشبینی ویژگیهای فیزیکی و شیمیایی مواد، منجر به روشهای نوآورانه در شیمی و علم و مهندسی مواد شده است.
از سوی دیگر حوزه اینترنت اشیاء (IOT) که شبکهای از اشیاء فیزیکی را توصیف میکند که به اندازهگیری و تبادل دادگان مرتبط با محیط فیزیکی در بستر اینترنت میپردازند، شاهد پیشرفت چشمگیری در سالهای اخیر بوده است. این شبکه در کاربردهای وسیعی از اشیاء خانگی معمولی گرفته تا ابزارهای صنعتی پیچیده به کار گرفته میشوند. شبکههای اینترنت اشیاء که هدف غایی آنها بهبود راندمان سیستمها از طریق پایش هوشمند محیط واقعی در قالب فرآیندهای خودکار است، حجم داده بزرگی از اطلاعات فیزیکی را جمعآوری مینمایند که نیاز به تحلیل مناسب و کارآمد دارند.
شبکههای یکپارچه فضایی-هوایی-زمینی و شبکههای ویژه هوانوردی
با رشد ترافیک هوایی بین قارهای، مفهوم جدید شبکههای هوانوردی ad hoc که بر هواپیماهای مسافربری تجاری متکی است، به طور بالقوه قادر به بهبود ارتباطات دریایی مبتنی بر ماهواره از طریق پیوندهای هوا به زمین و هوا به هوا است.
با توجه به اینکه بیش از 70 درصد از سطح زمین توسط اقیانوسها پوشیده شده است، افزایش فعالیتهای پراکنده در سراسر اقیانوسها تقاضای زیادی برای ارتباطات دریایی ایجاد کرده است. امروزه حمل و نقل به طور عمده به ماهوارهها برای پوشش بدون درز متکی است. با این وجود، به دلیل پوشش گسترده یک ماهواره، پهنای باند اختصاص داده شده برای هر کاربر در واقع محدود است. علاوه بر این، تعداد فزایندهای از هواپیماهای مسافربری بین قارهای در بالای اقیانوس وجود دارد که منجر به افزایش تقاضا برای اتصال به اینترنت در پرواز میشود. مانند کشتیها، هواپیماها نیز با محدودیتهای اتصال ماهوارهای مشابهی روبرو هستند. بنابراین، مفهوم شبکه ad-hoc هوانوردی برای تشکیل یک شبکه بیسیم خود پیکربندی شده از طریق پیوندهای ارتباطی هوا به هوا پیشنهاد شده است. به عبارت دیگر، تصور ترکیبی از ماهوارهها و هواپیماها برای تشکیل یک شبکه یکپارچه فضا-هوا-زمین برای پشتیبانی از ارتباطات دریایی آینده، یک الهام از طبیعت است. قابل ذکر است، طراحی و بهینهسازی شبکههای یکپارچه فضا-هوا-زمین با چالشهای متعددی مواجه است! برای مثال، یکی از موارد اساسی، طراحی یک پروتکل مسیریابی کارآمد برای ساخت مسیریابی دادههای ممکن در هر زمان معین با هدف سازگاری با توپولوژی شبکه بسیار پویا است. در چنین برنامههایی، استفاده از ایدهها، الگوریتمها و ابزارهای مرتبط با علم داده برای ارائه راهحلهای مبتنی بر دادههای جدید برای شبکههای یکپارچه فضا-هوا-زمین آینده بسیار مورد نیاز است.