به نظر میاد فناوری درک تصاویر مایکروساقت، زودتر از زمانی که انتظارش رو داشتم داره وارد زندگی روزمره میشه (با توجه به کمیت و کیفیت اینترنت ایران، تا ۴۰ سال آینده انشاالله وارد زندگی روزمره ما هم میشه)
امروز که رفتم توی سایت واندرایو دیدم توی تصاویر بخشی به اسم Tags اضافه شده. وقتی اون صفحه رو باز کردم با کلی عکس توی دستههای مختلف مواجه شدم!
اولش حدس زدم که اینها بر اساس تگهایی که من روی صورت افراد زدم دسته بندی شدن (به نوشتههای زیر دستهبندیها دقت نکردم) ولی بعد دیدم که اینها، تگهای افراد نیستن بلکه عکسهای من رو بهصورت موضوعی دستهبندی کرده.
اگر برنامهنویس باشید میدونید که این کار اصلن آسون نیست و من رو یاد این عکس xkcd میندازه
در آخر توجهتون رو به تعدادی از تشخیصهای این سیستم جلب میکنم:
این دستهبندی Textایه که برای من درست کرده، حتی متنهای فارسی رو هم تشخیص داده!
پایین هر عکس تگش رو نوشته:
و البته این سیستم اشتباه هم داره هنوز:
پینوشت: گوگل هم پیشرفت جالبی داره. برای پیدا کردن اون عکس xkcd توی گوگل سرچ کردم xkcd bird detector و اولین لینک نتیجهای که میخواستم بود در صورتی که هیچجای صفحه bird یا detector نبود.
پینوشت ۲: این فناوری مایکروسافت رو بذارید کنار هالولنز…
پینوشت ۳: فلسفه وجود تگ «خفن» اینه که این واقعا mind blowingئه و واقعا خفن، نتونستم در مقابل وسوسهش مقاومت کنم :)
خیلی جالبه! خوشم اومد!
سلام دوستان امیدوارم “همیشه خوب” باشید.
به نظر من “متن فارسی” رو تشخیص نمیده فقط تشخیص میده که “متن”ه.
خب متن ظاهرش سادس: یه سری طرح که رنگشون تقریبا نزدیک به نگاتیوِ رنگِ پس زمینس و به صورت «خط به خط» یا «ستون به ستون» و منظم دیده میشه.
ساختن یه همچین جدا کننده ی تصویری شاید با : (یه هوش مصنوعی خیلی خیلی خیلی خفن) + (یه بانک اطلاعاتی خیلی خیلی خیلی خفن) ممکن شده باشه.
به نظرم اگه علاوه بر این امکان، امکان OCR رو هم اضافه کنه خوبه
واقعا جالب بود و اصلا نمیدونستم! چون بیشتر از دراپ باکس استفاده میکنم.