راهبرد آینده در دست نوآوران

بی شک یکی از مهمترین تحولات عصر جدید انقلاب تکنولوژی است بویژه در شرایطی که از یکسو تولید داده و منابع دیجیتال بصورت نمایی و انفجاری در حال رشد است و از سوی دیگر دسترسی جامعه به سیستمهای هوشمند رایانه‌ای نیاز مخاطبین را بسیار دیگرگون ساخته است. این نکات تهدیدهای آتی مراکز مدیریت دانش و اطلاعات هستند، یک رویکرد می‌تواند تلاش در راستای بی توجهی و یا حتی سرکوب این تهدید در کلام باشد و رویکرد دیگر می‌تواند این تهدید را با برنامه‌ای مناسب به یک فرصت تبدیل کند.

حجم داده تولیدی بشر در دو سال گذشته برابر 90 درصد کل اطلاعاتی است که بشر در طول تاریخ ایجاد کرده است. این حجم از تولید و نشر اطلاعات بر ما روشن می‌سازد که گردآوری، سازماندهی و اطلاع‌رسانی این حجم از اطلاعات نیازمند تحولی جدی در فرایندها و رویکردها است.

از سوی دیگر بر کسی پوشیده نیست که اقتصاد دیجیتال، آینده‌ی اقتصاد دنیا است و پیش‌بینی می‌شود گردش مالی جهانی کسب و کارهای مبتنی بر فناوریهای حوزه محتوا بویژه هوش مصنوعی تا 3 سال آینده از مرز 100 میلیارد دلار عبور کند، که این مهم در صورت سیاستگذاری مناسب فرصتی مناسب برای حضور جوانان خلاق و هوشمند ایران زمین فراهم می‌کند.

از سوی دیگر نیاز جامعه پژوهشی نیز روز به روز توسعه یافته تر و متنوع تر می‌شود و کار به جایی می‌رسد که پژوهشگران، دستیاران پژوهش هوشمند را مطالبه می‌کنند. در این وادی اگر مراکز اطلاعات، کتابخانه ها و آرشیوها خدمات مناسب، هوشمند و به روز ارائه ندهند در این عرصه رقابت بدل به موزه خواهند شد.

نیاز سازمان اسناد و کتابخانه ملی

آینده کتابخانه‌ها و مراکز آرشیوی با هجوم حجم گسترده منابع دیجیتال از یکسو و گسترش وسایل ارتباطی از سوی دیگر مجالی برای ارائه خدمات بر پایه رویکردهای سنتی کتابخانه‌ای نگذاشته است و اگر تهدید تکنولوژی و عقب‌ماندگی از آن را به فرصت بدل نکنیم دیگر بطور کلی جایگاه خویش را در ارائه خدمت به پژوهشگران از دست خواهیم داد. به بیان دیگر این نیاز امروز جامعه است و چنانچه سازمان اسناد و کتابخانه ملی همچون گذشته غافلانه با آن برخورد کند یا یک بخش دیگر دولت آنرا پاسخ می‌دهد و یا بخش خصوصی با توان و توشه‌ای کم مقدار آنرا انجام خواهند داد که در هر دو صورت سازمان مرجعیت خود را بیش از پیش از دست خواهد داد و در نهایت خدمات مناسب به مخاطبین به سختی و تاخیر خواهد رسید.

از این روی سازمان نیاز دارد تا برخی از خدماتی را که تا به امروز با تکیه بر نیروی انسانی ارائه می‌داده است یا امکان ارائه آن میسر نبوده را به کمک فناوریهای هوش مصنوعی، تحلیل داده‌های کلان، بلاکچین یا سایر فناوریها تهیه و با سرعت، دقت، کیفیت و تنوع مناسب تری در اختیار مخاطبین فرهیخته خویش قرار دهد.

نیاز گروه های استارتاپی حوزه محتوا

غالب استارتاپهای تا به امروز فعال و موفق کشورمان در وادی ارائه پلتفرمی خدمات کسب و کار خویش را استوار کرده بودند و تلاش داشتند تا اتصال پلتفرمی و شفاف ارائه دهنده و ارائه گیرنده کالا یا خدمت را میسر کنند و نسل بعدی استارتاپهای با فناوری پیشرفته هنوز بدرستی فعال نشده‌اند. توسعه استارتاپهای حوزه محتوا با تکیه بر تکنولوژی‌های پیشرفته هوش مصنوعی و تحلیل داده کلان نیازمند داده‌های کلان دیجیتال و دسته‌بندی‌شده زبان فارسی است که پیشتر توسط انسانی پردازش شده باشند، این داده‌های در کنار فراداده‌های پردازش شده آنها، سامانه‌های هوش مصنوعی را آموزش می‌دهند و برای خدمات نوین آماده می‌کنند. این مهم در جهان اگرچه برای زبانهای دیگر رخ داده و توسعه یافته است، اما برای زبان فارسی که جز ایران، تاجیکستان و افغانستان حامی دولتی دیگری ندارد هنوز رخ نداده است. از سوی دیگر بازار بسیار بزرگی (از باب تعداد و توان مالی) هم نبوده و مشکلات این سه کشور از تحریم گرفته تا ضعف اقتصادی، بستر را برای سرمایه گذاری غولهای بین‌المللی نیز چندان فراهم نکرده است.

این مساله زمانی رنگ مهمتری به خود می‌گیرد که بدانیم سازمان بزرگترین گنجینه منابع فارسی جهان را در اختیار دارد و با ورود خود می‌تواند کمک به رفع این مانع بزرگ توسعه فناوری های هوش مصنوعی در کشور باشد و بهترین حامی و پشتیبان توسعه این استارتاپهای باشد.

اقدامات سازمان در حوزه نوآوری

طرح نوآوري سازمان از سال 1397 بر پايه سه هدف زير آغاز شد:

  • ايجاد بستر مناسب براي دريافت راه‌حل‌هاي نوآورانه به منظور حل چالش‌ها و مشکلات سازمان از طريق کسب و کارهاي نوپا در حوزه محتوي؛
  • ايجاد ارزش ‌افزوده بر پايه داده‌ها و محتواهاي موجود؛
  • ايجاد فضايي براي رشد ايده‌هاي نو در زمينه محتوا و تکنولوژيهاي کتابخانه‌اي و آرشيوي.

اين طرح براي نخستين بار با همکاري سازمان فناوري اطلاعات کشور و معاونت علمي و فناوري رياست ‌جمهوري و با مشارکت شتاب‌دهنده خصوصي نوين‌تک و مرکز نوآوري دانشکده برق و دانشکده کامپيوتر دانشگاه تهران و صندوق نوآوري و شکوفايي، اولين رويداد بر مبناي چالش‌ها (برگزاري رويداد معرفي معکوس Reverse Pitch) در حوزه محتوا بر اساس بزرگترين گنجينه محتواي فارسي و در راستاي اهداف فوق برگزار شد.

نخستين اعلام حضور سازمان در اين عرصه و رونمايي از طرح اين برنامه نوآوري در رويداد ويتا در تيرماه 1398 برگزار شد که مورد استقبال متخصصين حوزه فناوريهاي هوش مصنوعي قرار گرفت. از جمله اقدامات اجرايي اين رويداد مي‌توان موارد ذيل را برشمرد:

  • تهيه داده‌هاي مورد نياز تيمهاي شرکت کننده در رويداد ويتا
  • جلسات تخصصي با تيمهاي شرکت کننده در رويداد ويتا به منظور بررسي ابعاد اجرايي طرحها
  • آماده سازي فراداده‌ها و OCR پايان نامه ها براي تيم creative minds

اين رويداد با مشارکت 352 نفر و ارائه 90 طرح آغاز شد. در حال حاضر 7 طرح از خروجي گروه‌هاي استارتاپي در مرکز رشد سازمان فعال هستند.

از جمله دستاوردهاي برگزاري رويداد ويتا، شناسايي استعدادهاي موجود در سطح کشور براي اجراي طرح‌هايي است که پتانسيل موجود در سازمان را در جهت ارائه خدمات نوين اطلاعاتي شناسايي نمايد. در اين راستا انتشارات روزبهان که بزرگترين فروشنده آنلاين کتاب و محصولات فرهنگي است پيشنهاد همکاري در جهت ارائه داده‌هاي سازمان در قالبي نوين و با استفاده از فن‌آوري‌هاي هوش مصنوعي ارائه نمود. انجام مطالعات وسيع در خصوص جزئيات فني همکاري سازمان با انتشارات روزبهان و رسيدن به نقطه مشترک براي شروع فعاليت‌ها بوده است.

در همين راستا، ساختمان 6 طبقه سازمان واقع در خيابان به‌آفرين با زيربناي حدود 1250 متر مربع ، با حمايت معاونت علمي و فناوري رييس جمهور، بازسازي و تبديل به ساختمان نوآوري سازمان با هدف راه اندازي و توسعه فعاليت‌هاي نوآورانه گشت و محل استقرار، آموزش و فعاليت استارتاپهاي اين حوزه خواهد بود. طبقات اجرايي اين ساختمان عبارت است از:

  • طبقه همکف لابي برج ليبتک و محل استقرار ميز خدمت؛
  • طبقه اول: فضاي کار اشتراکي؛
  • طبقه دوم: فضاي کار اشتراکي اقتصاد ديجيتال؛
  • طبقه سوم: مرکز توسعه خدمات ليبتک؛
  • طبقه چهارم: آکادمي ليبتک؛
  • طبقه پنجم: کافه و مرکز سرگرمي ليبتک.

با تکیه بر ضرورتهای پیش گفته، از سال 1397 با همکاری معاونت علم و فناوری ریاست جمهوری، وزارت ارتباطات و فناوری اطلاعات و صندوق نوآوری و شکوفایی طرح نورآوری سازمان تنظیم شد، و سازمان به عنوان بخشی از دولت که دارنده منابع غنی فارسی است برای حمایت از استارتاپهای حوزه محتوا اعلام آمادگی کرد و برنامه ای با برند فناوریهای حوزه کتابخانه و آرشیو یا LibTech طراحی و پیاده سازی کرد.

مرکز نوآوری و توسعه کسب و کارهای داده محور

برای پیشبرد اهداف فوق و کمک به توسعه کسب و کارهای داده محور از یکسو و تزریق نوآوری در سازمان، مرکز نوآوری و توسعه کسب و کارهای داده محور در تیرماه سال 1399 با حضور دکتر سورنا ستاری در ساختمانی به مساحت 1500 متر مربع در 5 طبقه افتتاح شد. این مرکز پیشران برنامه نوآوری سازمان است و نقطه اتصال و تعامل سازمان با سایر گروههای استارتاپی، شرکتها و سیاستگذاران این اکوسیستم است.

این مرکز تلاش دارد در نقد سیاستهای بخشهای دولتی که بصورت فصلی به این وادی پا نهاده‌اند و نمایشهای خوبی برپا ساخته‌اند، در هرجا که بخش خصوصی توانسته موثر ایفای نقش کند و نیاز جامعه را مرتفع سازد ورود رقابتی با آنها نداشته و توان بخش خصوصی را به مشارکت دعوت کند. از این دسته می‌توان به شتابدهنده‌ها اشاره داشت، که با توجه به توان امروز شتابدهنده های خصوصی کشور دیگر نیازی برای راه‌اندازی یک شتابدهنده جدید برای سازمان احساس نمی شود و در رویدادها و فرایندهای بعدی توسعه استارتاپها از ظرفیت شتابدهنده‌های کشور استفاده می‌نماید. سایر حلقه‌های بلوغ و توسعه کسب و کارها نیز با همکاری بخش خصوصی در ساختمان نوآوری سازمان راه اندازی شده است که از آن جمله می‌توان به موارد ذیل اشاره داشت:

1-1 فضای کار اشتراکی

فضایی برای استقرار گروههای استارتاپی برای کاهش هزینه‌های شرکت‌داری و هزینه‌های تهیه و نگهداری دفتر و فضای کار با همکاری بخش خصوصی انجام یافته است.

1-2 فضای کار اختصاصی

فضایی اختصاصی (اتاق مستقل) با امکانات به اشتراک گذاشته اداری برای استقرار آن دسته از گروههای استارتاپی که گامهای اولیه مستقل شدن را طی می‌کنند.

1-3 مرکز رویداد

بخشی از این مرکز باید متمرکز بر روی شناخت چالشهای سازمان استخراج آنها و طراحی رویدادهایی برای به همکاری و مشارکت طلبیدن گروههای استارتاپی برای حل آنها باشد و از سوی دیگر فضایی برای آشنایی سایر ارکان اکوسیستم با این مرکز هم طراحی نماید. این مهم نیز با همکاری بخش خصوصی در مرکز راه اندازی شده است و تا پیش از کرونا رویداد لیبتک 1 را با عنوان ویتا بخوبی برگزار نموده است.

1-4 لیبتک استودیو

از مهمترین مراکز مستقر در ساختمان نوآوری که برای هدایت و حمایت استارتاپها در این عرصه جدید نوآوری ایجاد می‌شود کارگاه فناوریهای کتابخانه ای و آرشیوی است که با پردازش اولیه داده‌های سازمان به عنوان یک پیش شتابدهنده عرصه را برای فعالیت سایر استارتاپها تسهیل می‌نماید. در حال حاضر یکی از مهمترین پروژه‌های این بخش راه اندازی پایگاه دادگان کلان فارسی است که در بخش خود بدان پرداخته می‌شود.

1-5 لیبتک آکادمی

حلقه آخر این اکوسیستم شاید آموزشهای تخصصی باشد. مرکزی که آموزشهای تخصصی این حوزه را به شیوه‌های نوین و مطلوب مخاطب ویژه این حوزه بتواند ارائه دهد گام دیگر حمایتی این برنامه نوآوری سازمان خواهد بود که به کمک بخش خصوصی راهاندازی و هدایت می‌شود. این مهم با همکاری ستاد اقتصاد دیجیتال معاونت علم و فناوری ریاست جمهوری در حال راه اندازی است.

1-6 تجهیزات زیرساختی

یکی از مهمترین نیازمندی‌های گروههای استارتاپی فناوری‌های کتابخانه‌ای و آرشیوی تجهیز لازم برای پردازشهای تصویری گسترده و پرحجم است. تجهیز مرکز داده حمدایران متعلق با سازمان در راستای حمایت از این نهالهای عرصه جدید نوآوری با حمایت معاونت علمی و فناوری انجام یافته است، از سوی دیگر اخذ این خدمات از بخش خصوصی نیز فرصت دیگری برای حمایت از گروههای استارتاپی مورد حمایت خواهد بود.

2- ساختمان نوآوری سازمان

یکی از مهمترین نیازهای این مرکز فضای کالبدی استقرار ارکان این برنامه توسعه است. از همین روی ساختمان 5 طبقه سازمان واقع در خیابان به‌آفرین، با کمک معاونت علم و فناوری بصورت اساسی بازسازی و به‌سازی شده است و بدل به ساختمان نوآوری سازمان یا ساختمان LibTech و محل استقرار، مرکز نوآوری و توسعه کسب و کارهای داده محور و گروههای استارتاپی شده است.

ساختمان پیشین آرشیو ملی ایران که پیش از این به مدت 15 سال بدون استفاده بوده است با این نوسازی به سومین ساختمان فعال سازمان در شهر تهران بدل شد، با کارویژه ای نوین و معطوف به آینده.

3-صندوق پژوهش و فناوری

آخرین گام مسیر توسعه کسب و کارهای نوپا سرمایه گذاری روی آنهاست و از آنجا که موفقیت آنها دارای ریسک بالایی است در اصطلاح سرایه گذاری خطرپذیر می‌گویند. به منظور حمایت و سرمایه گذاری در استارتاپهای مستعد این حوزه بصورت تخصصی صندوق پژوهش و فناوری سازمان با حمایت معاونت علم و فناوری و صندوق نوآوری و شکوفایی در حال تاسیس است. این صندوق سرمایه‌گذاری خطر‌پذیر به عنوان بازوی حمایتی سازمان برای پشتیبانی از استارتاپهای موفق این عرصه ایفای نقش می‌کند. شایان ذکر است این صندوق طبق مصوبه صندوق نوآوری و شکوفایی با مشارکت 60 درصدی بخش خصوصی در حال راه اندازی است.

4-رویداد ویتا

نخستین اعلام حضور سازمان در این وادی و رونمایی از طرح این برنامه نوآوری در یک رویداد معرفی معکوس(Reverse Pitch) با نام ویتا در تیرماه 1398 با همکاری دانشگاه تهران، و شتابدهنده خصوصی نوین تک، معاونت علم و فناوری و سازمان فناوری با معرفی چالشهای سازمان برگزار شد که مورد استقبال بی سابقه متخصصین حوزه فناوریهای هوش مصنوع قرار گرفت، بطوری که از 350 نفر شرکت کننده در این رویداد حاضر شدند.

3 گروه استارتاپی نخستین خروجی رویداد ویتا است که هم اکنون در مرکز رشد سازمان فعال هستند که محصولات ذیل را ارائه خواهند نمود

  • 4-1 سندجو: این گروه تلاش دارد تا با کمک هوش مصنوعی متن نسخ خطی و اسناد تاریخی را قابل جستجو کند.
  • 4-2 چت بات: این گروه تلاش دارد مرجع مجازی سازمان که در این بخش چند نفر از متخصصین کتابداری وظیفه پاسخگویی به پرسشهای مراجعین در حوزه منبع شناسی و جستجوی کتاب را عهده دار است با کمک هوش مصنوعی توسط یک ربات انجام دهد.
  • 4-3 ریکپچا: تلاش دارد در جایگزین کپچای رایگان گوگل با سامانه ای تصویر نسخ خطی و اسناد تاریخی را با کمک جمع‌سپاری و هوش مصنوعی به متن تبدیل کند. لازم به ذکر است که کپچای گوگل سرویس شناسایی انسان بودن مخاطب یک سامانه است که با درخواست به تایپ کردن تصویر عددی ارائه شده این مهم را تایید می‌کند.
  • 4-4 راهنما: رویکردی جدید برای جستجوی بهتر در کتابفروشی ها، با استفاده از فراداده استاندارد و امکان دسته بندی موضوعی در کتابفروشی به مانند کتابخانه ها و در نهایت تسهیل جستجوی کتاب برای خرید آن.

5- پردازش خودکار- فاز نخست: فهرست توصیفی

حجم گسترده منابع دیجیتال دیگر مجالی برای مدیران مراکز دانش و اطلاعاتی برای استفاده از شیوه‌های سنتی و قدیمی را در زمینه پردازش و اطلاع رسانی منابع نمی‌دهد. به عنوان مثال مجموعه نزدیک به 500 هزار مقاله که در سال 1398 به گنجینه سازمان افزوده شده اگر می‌خواست به شیوه سنتی و توسط انسان پردازش شود با اتکا به نیروهای فعلی سازمان و به فرض متوقف شدن ورودی جاری سازمان نزدیک به 8 سال زمان نیاز داشت.

در همین راستا برای استفاده بیشتر از ظرفیت تکنولوژی در امر پردازش منابع، سازمان اقدام به راه اندازی سامانه ای کرد که بتواند بصورت خودکار و ماشینی فهرست نویسی را انجام دهد. فاز نخست این سامانه که در دیماه 1398 به بهره برداری رسید در ابتدا فایل تصویر را تبدیل به متن می‌کند و از دل متن تبدیل یافته فراداده را استخراج می‌کند. این سامانه پروژه 8 ساله را یعنی پردازش 500 هزار مقاله را در مدت دو ماه (البته با امکانات سخت افزاری محدود فعلی) انجام می‌دهد. این سامانه که اکنون برای استخراج فراداده مقاله تنظیم شده است.

در تکمیل فاز نخست جهت خودکارسازی استخراج اطلاعات مندرج در منبع اطلاعات سازمان امروز مجهز به سامانه ای است که به کمک هوش مصنوعی با روش یادگیری عمیق با دقت مناسب اطلاعات مندرج در انواع منابع مکتوب را از نسخه دیجیتال منبع استخراج و در چارچوب استاندارد مارک ایران ارائه می‌نماید. این سامانه تاکنون بر روی سه منبع پایان نامه، کتاب و مقاله تمرکز نموده است و در بهمن ماه 1399 رونمایی شده است.

با این سامانه کلیه اطلاعات فهرست نویسی (توصیفی و تحلیلی) مقاله و پایان نامه تکمیل می‌شود، چرا که کلید واژه در مقاله و چکیده در پایان نامه مستقر است و با اتمام این فرایند اطلاعات مورد نیاز این دو نوع منبع با حداقل نظارت انسانی تکمیل می‌شود.

اما در باب کتاب مساله متفاوت است، اطلاعات توصیفی موجود در کتاب نیمی از اطلاعات مهم مورد نیاز برای سامانه جستجو برای کمک به بازیابی اطلاعات برای مخاطبین است و دادن موضوع، و رده به کتاب نیازمند انسان است و این سامانه کمکی نمی تواند بکند.

6- پردازش خودکار- فاز دو: فهرست تحلیلی

فاز دوم این پروژه تلاش دارد تا به کمک هوش مصنوعی بر اساس محتوای تبدیل به متن شده منبع، فهرست تحلیلی متن را تعیین کند. به بیان دیگر هوش مصنوعی برای تعیین موضوع و رده کتاب یا هر منبع دیگری به کمک آمده و بر اساس الگوهای از پیش آموزش یافته خود به مرور با دقت و سرعتی بالا به عنوان دستیار توانمند فهرست نویس این مهم را محقق سازد که این مهم در رویدد لیبتک 2 در زمستان سال 1399 از 20 دی تا 20 اسفند) در حال عملیاتی شدن است.

بخش دیگری که سازمان قصد دارد آنرا عملیاتی سازد استخراج فهرست نشریات ایران است. تاکنون رویکرد پردازش نشریات در ایران و جهان متکی به شیوه کاردکس بوده است و تنها اطلاعات بسیار مختصری از نشریه مربوطه ارائه می‌شده است و پژوهشگر برای جستجو در آنها یا باید به اطلاعات پیشینی خویش اتکا کند و یا به تورق در لابلای نشریات به شیوه سنتی می‌توانند از اطلاعات مندرج در آن استفاده کنند. این مهم در قالب یک رویداد توسط سازمان برای نخستین بار در حال طراحی و برگزاری است.

7- رویداد لیبتک2

برای کمک به دستیابی

چالش تشخیص موضوع منبع مکتوب محور اصلی رویداد استارتاپی سازمان شد. در این رویداد تلاش است با تمرکز بر تشخیص موضوع Topic Detection در گام نخست داده رده کنگره به کتاب را به کمک هوش مصنوعی خودکار سازد. 

برای این مهم برای نخستین بار یک نمونه داده ای با بیش از 200 هزار عنوان کتاب با رده‌های تعیین شده توسط فهرست نویسان کتابخانه ملی تهیه تا در فرصت دو ماهه به شرکت کنندگان این رویداد ارائه تا بالاترین دقت سامانه‌های درون رقابت انتخاب شود. تیم برنده علاوه بر دریافت جایزه، موظف به عقد قرارداد و ادامه آموزش سامانه برای افزایش دقت این تشخیص است.

این رویداد آغازگر فاز 2 پردازش خودکار: فهرست نویسی تحلیلی است و که در این مرحله دادن رده کنگره به کتب ارائه شده بصورت خودکار انجام می‌شود. در ادامه و به مرور با تکمیل داده‌های نمونه بر اساس کتب و موضوعات داده شده به آنها، سامانه برای تشخیص موضوع و دادن موضوع‌ها به کتاب به عنوان دستیار فهرست نویس مهیا می‌شود.

login