راه اندازی سامانه پیکرههای هوش مصنوعی توسعه پرسش و پاسخ و محاوره فارسی
تاریخ انتشار: ۲۹ مرداد ۱۴۰۲ | کد خبر: ۳۸۵۱۰۴۹۲
ستاد اقتصاد دانشبنیان دیجیتال، برنامه ویژهای را در جهت استخراج، دستهبندی و استفاده از این دادهها برای کسبوکارها و نهادهای مختلف در دستور کار خود قرار داده که نتیجه این تلاشها به طراحی و بهرهبرداری از سایتی به نام «دادگان» انجامیده است.
خبرگزاری برنا؛ «دادگان» با کمک هوش مصنوعی و ابزارهای مرتبط به این فناوری جدید و به روز، اقدام به جمعآوری دادهها و کلان دادهها کرده و در نهایت به ارتقاء سطح کمی و کیفی کسب و کارها کمک شایانی میکند.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
در دنیای دیجیتالی اهمیت دادهها و اطلاعات بسیار بیش از گذشته برای کسبوکارها مشخص و نمایان شده، به طوری که بسیاری از کارشناسان و فعالان حوزه کلان دادهها و دادهها از آنها به عنوان یک منبع درآمدزایی بزرگ در سطح منابع انرژی یاد میکنند. در جهان کسبوکار امروز، این، دادهها هستند که کسبوکارها را جهتدهی میکنند و به عنوان نقشه راهی برای آینده آنها عمل میکنند.
به طور مثال، دادههای رفتار خریداران و مصرفکنندگان یک سامانه فروشگاهی میتواند به صاحبان کسبوکار نشان دهد که خریداران و مصرفکنندگان دقیقاً به چه چیزهایی نیاز دارند و نسبت به همین دادهها و اطلاعات اقدام به تأمین نیازهای مشتریان خود کند. مثالهایی که تعداد آنها بسیار زیاد و متنوع هستند
از این روی، استخراج اطلاعات مهم از بین انبوهی از دادهها و رسیدن به بینشی درست یکی از تخصصهای بسیار مهم است که برای بقای کسب و کارهایی که با کلان دادهها سر و کار دارند اهمیت بسیاری دارد و میتوان با توسعه دادن هوش مصنوعی از آن برای استخراج دادهها و داده کاوی هوشمند استفاده کرد.
ستاد اقتصاد دانشبنیان دیجیتال نیز برنامه ویژهای را در جهت استخراج، دستهبندی و استفاده از این دادهها برای کسبوکارها و نهادهای مختلف در دستور کار خود قرار داد که نتیجه این تلاشها به طراحی و بهرهبرداری از سایتی به نام دادگان انجامیده است.
در ادامه این گزارش به بررسی و معرفی بخشهای مختلف سایت دادگان میپردازیم.
پیکواد، پیکرهای برای کمک به پژوهش بر روی درک مطلب ماشینی و توسعه سیستمهای پرسش و پاسخ به زبان فارسی
پیکواد یک مجموعه داده برای درک مطلب ماشینی به زبان فارسی است. این مجموعه شامل 80 هزار سوال به همراه پاسخ آنها است. سوالات پیکواد از مقالات ویکیپدیای فارسی استخراج شدهاند. جمع کل پاراگرافها ۱۱هزارتا است که به هزار و ۱۲۵ مقاله تعلق دارد و طیف وسیعی از موضوعها را پوشش میدهند.
پیکواد به عنوان یک مجموعه داده درک مطلب ماشینی نیاز به یک سیستم پرسش و پاسخ دارد تا یک متن را بخواند و سپس سوالات مطرح شده از آن متن را پاسخ بدهد. هدف از انتشار این مجموعه داده کمک به پژوهش بر روی درک مطلب ماشینی و توسعه سیستمهای پرسش و پاسخ به زبان فارسی است. از لحاظ ساختاری میتوان گفت پیکواد شباهتهایی به برخی قابلیتهای نرمافزار هوش مصنوعی چت جیپیتی (GPT) دارد.
پیکره و ماژول مشابهتیابی معنایی جملات با استفاده از فناوری هوش مصنوعی
یکی دیگر از بخشهای سامانه دادگان پیکره و ماژول مشابهتیابی معنای جملات است. هدف این پروژه ایجاد یک پیکره شباهت معنایی برای زبان فارسی است. در اینجا، منظور از شباهت معنایی فاصله معنایی بین دو جمله است، یعنی این که دو جمله از نظر محتوای واژگانی و موضوع کلی تا چه اندازه به هم شبیه یا از هم متفاوت هستند.
پیکره و فناوری گفتگوی روزمره زبان فارسی
بخش سوم سامانه دادگان، پیکره و فناوری گفتگوی روزمره زبان فارسی است. این پیکره، اولین پیکره زبان فارسی دیالوگ های فیلم و سریال های ایرانی به زبان فارسی و مناسب برای فناوری گفتگوی روزمره فارسی است که در رباتهای مجازی هوشمند ایرانی مورد استفاده قرار می گیرد
به گفته مسئولین این سامانه، پیکره فیلم وسریال دارای 100 هزار و 34 گفته است که به این عدد باید تعداد یک میلیون و 289 هزار و 283 گفته پیکره شبکه های مجازی را نیز اضافه کرد که در میان سرویسهای فارسی آمار خوبی محسوب میشود.
شایان ذکر است، دادگان برای راستیآزمایی دادههای جمعآوری شده، علاوه بر ارزیابی های مبتنی بر هوش مصنوعی ارزیابی مرحله قبلی توسط هر برچسب زن انجام شده و به صورت تصادفی نمونه هایی از هر مرحله مورد ارزیابی قرار گرفته است.
پیکره محاوره به رسمی
بخش چهارم و پایانی این سامانه نیز پیکره محاوره به رسمی است که کاربردهای بسیار زیادی خواهد داشت. در این پروژه حدود ۵۰ هزار جمله محاوره به معادل رسمی آنها تبدیل شده اند. پیکره حاصله شامل 50 هزار زوج جمله محاوره ای- رسمی و همترازی کلمات آنهاست. به عبارت دیگر علاوه بر زوج جملات معادل، برای هر جمله محاوره ای مشخص شده کدام کلمه یا عبارت آن، معادل با کدام کلمه یا عبارت در جمله رسمی است.
جملات محاوره ای از منابعی چون شبکه های اجتماعی مانند اینستاگرام و توئیتر، پیام رسانهایی مانند تلگرام و واتساپ، صفحات وب، وبلاگ ها، کتاب ها و فیلم هاجمع آوری شده یا توسط خود داده آمارها تولید شدهاند.
در این پیکره تقریبا نیمی از جملات محاوره ای از ساختار نحوی رسمی برخوردار نبوده و برای تبدیل آنها به شکل رسمی علاوه بر تغییر واژه های محاوره ای نیاز به اصلاح ساختار دستوری نیز بوده است.
پیاده سازی هوش مصنوعی بدون دادگان مناسب امکان پذیر است ؟
هوش مصنوعی در واقع همان علمی است که به ماشینها کمک میکند تا همانند یک انسان هوشمند رفتار کنند و بتوانند وظایف مختلفی را اجرا کنند. هوشمند شدن هوش مصنوعی نیز به وسیله داده اتفاق میافتد. به این صورت که برای اینکه هوش مصنوعی بتواند یک مشکل در حوزهای خاص را حل کند، دادهها و اطلاعات مربوط به آن را جمع آوری میکند تا از آنها برای آموزش سیستم استفاده کند.
به گفته مسئولان این سامانه، در این برهه از زمان که کاربست فناوریهای دیجیتال، در تمامی ساحات زندگی بشر جلوهگر شده، ضرورت توجه متمرکز به آنان با وضوح بیشتری نسبت به گذشته بر همگان عیان شده است . بنابراین مرکز توسعه فناوری های نو ظهور دیجیتال در نظر دارد با حمایت وکمک به توسعه زیر ساخت های این فناوری های جدید عرصه را برای حضور و توسعه زیست بوم دانش بنیان فراهم نماید .
انتهای پیام/
آیا این خبر مفید بود؟نتیجه بر اساس رای موافق و رای مخالف
منبع: خبرگزاری برنا
کلیدواژه: اقتصاد پرسش و پاسخ جهان وبلاگ هوش مصنوعی علم و فناوری زبان فارسی زبان فارسی پرسش و پاسخ هوش مصنوعی کسب وکارها محاوره ای داده ها جمع آوری
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت www.borna.news دریافت کردهاست، لذا منبع این خبر، وبسایت «خبرگزاری برنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۸۵۱۰۴۹۲ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
سامانه آموزشی ترید در بازار ارز دیجیتال مبتنیبر هوش مصنوعی طراحی شد
مجتبی صفری سرپرست یک شرکت خلاق فعال در زمینه فناوریهای مالی هوشمند مستقر در کارخانه نوآوری آزادی، درباره ماهیت دقیق «سامانه آموزشی ترید در بازار ارز دیجیتال» به خبرنگار خبرگزاری علم و فناوری آنا توضیح داد: این سامانه، یک پلتفرم هوشمند برای آموزش و آزمون خطا در یک محیط کاملا نزدیک به واقعیت برای فعالیت در بازار ارز دیجیتال و بهویژه کریپتو است.
وی افزود: در این سیستم، سه ربات هوشمند در قسمتهای مرتبط با فعالیت کاربر، تمام فرآیندهای انجامشده فرد را در معاملات آنلاین ارز دیجیتال، رصد و پیگیری کرده و درنهایت به کاربر، بازخورد و گزارش میدهند.
صفری درباره سطوح فعالیت رباتهای هوشمند این نرمافزار و خدماتی که ارائه میکنند، توضیح داد: در حوزههای پیداکردن فرصت معاملاتی در بازار ارز دیجیتال، اطلاعرسانی ایونتهای اقتصادی و بولتنهای خبری مرتبط و همچنین تحلیل تکنیکال عملکرد کاربر و نحوه معاملهکردن وی ازجمله خدمات رباتهای هوشمند در این نرمافزار است.
سرپرست این شرکت خلاق، در پاسخ به این سوال که آیا از طریق این سامانه هوشمند میتوان به بازارهای واقعی ارز دیجیتال متصل شد و معامله کرد، گفت: اکنون برای هرسطح کاربر، یک دسترسی به بازار تعریف شده است، برای مثال در سطح اول و ابتدایی، یک آکادمی تعاملی برای کاربران تعریف شده است تا بتوانند معاملهکردن با پول دیجیتال را یاد بگیرند.
وی افزود: یکی از مهمترین گامهای توسعهای برای این سامانه، اتصال کاربران به فضای واقعی معاملات و انجام فرآیندهای معامله الگوریتمی ارز دیجیتال در بازار واقعی است.
صفری با اشاره به بهرهگیری از هوش مصنوعی در طراحی این نرمافزار گفت: از فناوری هوش مصنوعی AI بهعنوان دستیاری هوشمند برای شخصیسازی دیتای کاربران و ارائه بازخورد معاملات ارزدیجیتال دربازار، استفاده شده است.
وی افزود: رفتار و سطح کاربر برای ارائه نوع بازخورد به فرد از هوش مصنوعی استفاده شده است.
مدیر این شرکت خلاق درباره خدماتی که توسط این سامانه ارائه میشود، توضیح داد: پلتفرم هوشمند آموزش معامله در بازار ارز دیجیتال به کاربران این امکان را میدهد که بدون دانش برنامهنویسی و با استفاده از ابزارهای مختلف تحلیل تکنیکال، تحلیل دادههای آنچین، دادههای اقتصاد کلان و شاخصهای مدیریت ریسک انواع استراتژیهای مختلف را تحلیل کنند.
وی ادامه داد: کاربران در این سامانه میتوانند علاوهبر دریافت آلارم و تحلیل دادههای بازار ارز دیجیتال، سفارشهای خود را در صرافیها ثبت کنند.
صفری به تعداد کاربران داخلی و خارجی این نرمافزار اشاره کرد و ادامه داد: علاوهبر کاربران داخلی، حدود هزار کاربر خارجی از شرکتهای کشورهای چین، ترکیه و امارات از این نرمافزار استفاده میکنند.
این فناور حوزه ارز دیجیتال بیان کرد: نرمافزار هوشمند آموزش ارز دیجیتال برای نخستینبار است که توسط متخصصان داخلی در دنیا طراحی میشود.
انتهای پیام/