TECHitMedia.NET

Бъди в крак с технологиите!

Търсачките с изкуствен интелект надминаха хората в изкуството да лъжат

Сподели с приятели.

Специалистите от Центъра за дигитална журналистика Tow към Columbia Journalism Review са проучили колко точно търсачките с изкуствен интелект определят източниците на новини. Резултатите не са обнадеждаващи: когато услугите с изкуствен интелект се опитват да намерят заглавието на статия, името на изданието или датата на публикуване по фрагмент от текст, те грешат в над 60% от случаите.

Проблемът е особено актуален на фона на нарастващата популярност на подобни инструменти. Авторите на изследването Клаудия Язвинская и Айсвария Чандрасекар установяват, че всеки четвърти американец вече предпочита да търси информация не чрез традиционните търсачки като Google или Bing а с помощта на системи, базирани на изкуствен интелект.

В хода на експеримента експертите тестват 8 услуги, способни да обработват заявки за търсене в реално време. Графиките ясно показаха мащаба на проблема: Grok 3 постави антирекорд, като сгреши в 94% от случаите. ChatGPT Search даваше грешни отговори на 67% от заявките (134 от 200). Дори лидерът по точност (системата Perplexity) допусна грешки в 37% от проверките.

Методологията на тестване не оставяше място за двусмислие: анализаторите копираха точни откъси от публикувани статии и поискаха от всяка система да идентифицира оригиналния източник на материала – да намери заглавието, издателя, времето на публикуване и уеб адреса. В хода на проучването те проведоха 1600 такива теста, като отбелязаха не само верността на отговорите, но и степента на увереност, с която алгоритмите ги предоставиха.

Вместо да разпознават пропуски в знанията, машините създавали правдоподобни, но напълно измислени отговори – т.нар. конфабулации. Те не се поколебаха да генерират несъществуващи цитати или да измислят убедително изглеждащи дати на публикуване. Това поведение се наблюдаваше при всички тествани софтуери.

Парадоксален факт: скъпите платени версии на търсачките показаха по-лоши от безплатните. Например, абонаментът за Perplexity Pro за 20 долара и Grok 3 за 40 долара на месец значително намали надеждността на резултатите. За разлика от базовите версии, които открито съобщават за невъзможността за намиране на отговор, премиум услугите се стремят да отговорят на всеки въпрос, дори ако той изисква въображение. Изводите са очевидни: парите не гарантират надеждна информация.

Отделен проблем е как системите с изкуствен интелект пренебрегват основните правила на интернет. Става дума за стандарта robots.txt – специален файл в уебсайтовете, който указва на роботите на търсачките кои страници могат да бъдат индексирани и кои не. Този протокол служи като основен инструмент за защита на съдържанието в продължение на много години. Новите услуги с изкуствен интелект обаче просто го игнорират. Безплатната версия на Perplexity лесно намери и обработи 10 статии на National Geographic, които бяха защитени от индексиране – въпреки че изданието изрично забрани на услугите с ИИ да имат достъп до съдържанието му.

Алгоритмите често пренасочват читателите не към оригиналните статии, а към сайтове-агрегатори като Yahoo News. Това се случва дори с материали на издания, които са подписали официални споразумения с разработчици на ИИ. Експертите отбелязват, че тази практика лишава издателите от легитимен трафик и приходи от реклама.

Повече от половината линкове, предлагани от Google Gemini и Grok 3 водят до несъществуващи страници. Статистиката на последния е особено лоша: от 200 проверени адреса 154 се оказаха неработещи.

По този начин издателите се оказват в истинска задънена улица. Да се забрани на алгоритмите да индексират материали чрез robots.txt означава да се загубят препратките към авторството, тъй като софтуерът все пак ще намери публикации на други сайтове. Даването на разрешение не означава никаква гаранция, че аудиторията ще стигне до оригиналния сайт източник.

OpenAI и Microsoft получиха резултатите от проучването, но предпочетоха да се измъкнат от официални отговори. OpenAI само повтори обещанието си да помага на издателите. Компанията ще цитира техните материали, ще дава директни линкове и винаги ще посочва източниците. Microsoft на свой ред заяви, че спазва правилата на robots.txt и се вслушва в желанията на притежателите на авторски права.

Източник: Kaldata

Leave a Reply

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

TECHitMedia.NET
Правила за бисквитките:

Относно бисквитките!

Тази политика обяснява подробно как “TECHitMedia.NET” използва всяка информация, събрана по време на всяка сесия на ползване от вас (наричана по-долу “Вашата информация”).

Вашата информация се събира по два начина. Първо, разглеждането на “ TECHitMedia.NET” ще накара софтуерът да създаде няколко бисквитки, представляващи малки текстови файлове, които се свалят при временните файлове на браузъра на Вашия компютър. Първите две бисквитки съдържат само потребителски идентификатор (наричан по-долу “user-id”) и анонимен идентификатор на сесията (наричан по-долу “session-id”), които са Ви автоматично назначени от софтуера. Трета бисквитка се създадена при преглеждане на теми в “ TECHitMedia.NET ” и се използва за запомняне на прочетените от Вас теми, подобрявайки работата Ви.

Ние можем също така да създадем бисквитки отвъд софтуера при разглеждане на “ TECHitMedia.NET ”, въпреки че те са извън обхвата на този документ, който е предназначен само за покриване на страници, създадени от софтуера. Вторият начин, по който ние събираме Вашата информация, е това какво Вие изпращате към нас. Това може да бъде, и не е ограничено до: писане като анонимен потребител (наричани по-долу “анонимни мнения”), регистриране в “ TECHitMedia.NET ” (наричан по-долу “Вашият акаунт”) и мнения, написани от Вас след регистрация използвайки акаунт (наричани по-долу “Вашите мнения”).

Вашият акаунт ще съдържа минимум уникално идентифициращо име (наричано по-долу “Вашето потребителско име”), лична парола за влизане във Вашия акаунт (наричана по-долу “Вашата парола”) и личен, валиден e-mail адрес (наричан по-долу “Вашият e-mail”). Вашата информация за Вашия акаунт в “ TECHitMedia.NET ” е защитена от законите за защита на данни, приложими в нашата страна. Всякаква информация, различна от Вашето потребителско име, Вашата парола и Вашия e-mail, която се изисква от “ TECHitMedia.NET ” в процеса на регистрация е или задължителна, или незадължителна, по преценка на “ TECHitMedia.NET ”. Във всички случаи, Вие можете да определите каква информация от Вашия акаунт е видима публично. При това, в рамките на Вашия акаунт, Вие можете да се запишете или да се отпишете от получаване на автоматично генерирани писма оt софтуера.

Вашата парола е шифрована (еднопосочно хеширана) така че да бъде в безопасност. Въпреки това е препоръчително да не използвате същата парола в други сайтове. Вашата парола е средството за достъп до Вашия акаунт в “ TECHitMedia.NET ”, затова моля пазете я внимателно и знайте, че при каквито и да било обстоятелства, никой от “ TECHitMedia.NET ”, или друга трета страна няма да поиска Вашата парола. Ако се случи да забравите Вашата парола за Вашия акаунт, можете да използвате функцията „Забравена парола“, предоставена от сайта. Този процес ще поиска от Вас да изпратите Вашето потребителско име и Вашия e-mail, след което TECHitMedia.NET софтуерът ще генерира нова парола, за да възстановите Вашия акаунт.