Yerevan, 05.December.2025,
00
:
00
BREAKING


Արհեստական ​​բանականությունն ի վիճակի է ստել մարդկանց՝ իր նպատակներին հասնելու համար. հետազոտություն

ՀԱՆՐԱՀԱՅՏ ՄՈԼՈՐՈՒԹՅՈՒՆՆԵՐ

Սեղմեք ԱՅՍՏԵՂ, լրացրեք օնլայն հայտը և մոռացեք հոսանքի վարձի մասին

Արհեստական ​​բանականության (AI) խոշոր մոդելները ի վիճակի են մոլորեցնել, երբ դրանց ստիպում են ստել՝ իրենց նպատակներին հասնելու համար, ցույց է տվել նոր հետազոտությունը:

ArXiv preprint տվյալների բազայում հրապարակված նոր հետազոտության մեջ մի խումբ գիտնականներ մշակել են ազնվության արձանագրությունը, որը կոչվում է «Պնդումների և մոդելային գիտելիքների համադրման» (MASK) չափանիշ:

Թեև տարբեր ուսումնասիրություններ և գործիքներ են մշակվել՝ որոշելու AI-ի կողմից օգտատերերին տրամադրվող տեղեկության փաստացի ճշգրտությունը, MASK չափանիշը մշակվել է որոշելու համար, թե արդյոք AI-ն հավատում է այն, ինչ ասում է, և ինչ հանգամանքներում կարող է ստիպել նրան փոխանցել տեղեկություն, որը, ինչպես «ի սկզբանե» գիտի՝ սխալ է:

Գիտնականների թիմը ստեղծել է 1528 օրինակներից կազմված մեծ տվյալների հավաքածու՝ պարզելու համար, թե արդյոք մեծ լեզվական մոդելներին (LLM)  համոզել հարկադիր հուշումներ օգնությամբ ստել օգտատիրոջը:

Գիտնականները փորձարկել են 30 լայնորեն օգտագործվող առաջատար մոդելներ և պարզել, որ ամենաառաջադեմ AI-ները հեշտությամբ ստում են, երբ նրանց նկատմամբ ճնշում է գործադրվում:

«Զարմանալիորեն, բայց այն ժամանակ առաջադեմ արհեստական բանականությունների մեծ մասը բարձր գնահատականներ են ստանում ճշմարտացիության չափանիշով, մենք պարզեցինք, որ առաջադեմ AI-ները հակված են ստել, երբ նրանց վրա ճնշում է գործադրվում, ինչը հանգեցնում է մեր չափանիշով ազնվության ցածր միավորների», - հայտարարել են գիտնականները հետազոտության մեջ:

Հետազոտության հեղինակները նշում են, որ թեև ավելի իրավասու մոդելները կարող են ավելի բարձր գնահատականներ ստանալ ճշտության թեստերում, դա կարող է պայմանավորված լինել ավելի լայն ապացույցների բազայով, որից կարող են տեղեկություն քաղել, այլ ոչ թե հանգամանքից, թե դրանք հակված չեն անազնիվ հայտարարություններ անել:

 Հետևեք մեզ՝ այստեղ

Acba bank and France’s Proparco to continue strengthening their long-term strategic partnershipTeam Holding Announces the Launch of Bond Placement. Underwriter - Freedom Broker Armenia Unibank Issues the First in Armenia Perpetual Bonds Team Holding Announces the Launch of Bond Placement. Underwriter - Freedom Broker Armenia AraratBank Joins Armenia's New Greening Initiative: 100 Hectares of New Forest within Three YearsApply for a Unibank salary card and get a chance to win 1 000 000 AMDEuromoney Names Ameriabank Armenia’s Best Bank for Real Estate for the Second Year in a Row S&P Global Ratings has assigned IDBank CJSC a long-term rating of “BB-” and a short-term rating of “B” with a “stable” prospectAn unprecedented Evening for the Armenian Fashion and Hospitality Industry: World-Renowned Dress Designer Jacob Meyer Presents His Masterpieces at the ONE&ONLY Antigravity Theatre in The Dvin HotelA Brand-New Section on Idram&IDBankSeveral real and profitable offers ahead of Black Friday: IDBank and IdramAraratBank Joins Social Impact Award 2025 Summit in LjubljanaIDBank issued the 1st tranche of bonds of 2026Ucom Supports the Development of Space Engineering in Armenia Prioritizing Information Security: IDBank and Idram Support APOCALYPSE CTF 2025IDBank's Representative, Innesa Amirbekyan Appointed Co-Chair of the ICC Banking Commission Task Force on GuaranteesUcom General Director Ralph Yirikian Awards Certificates to Participants of Cybersecurity Training Course Acba and Proparco mark one year of partnership, strengthening rural financing and Armenias’s economic resilienceAraratBank and Arca's joint campaign has endedIDBank: A Pioneer of Digital Banking and Innovation in ArmeniaGRAWE Group and C-Quadrat Investment Group have announced plans to acquire 100% of LIGA Insurance Company in Armenia Ucom Supports the Annual “Capture the Flag 2025” Cybersecurity Competition Financially Literate with Idram and IDBank: Next Stop – Nairi CampIdram received a permit to establish and operate the Armenian payment and settlement QR system IdramNetUcom Completes the Deployment of its 5G Network Across All Cities of Armenia Firebird, Inc. Secures U.S. Export License and Announces Dell Technologies as a Technology Partner, Establishing Major Milestones in Armenia’s AI and Digital FutureIDBank Receives Permission to Open a Representative Office in the United StatesRoboTon 2025 Competition Held with Idram’s Sponsorship“Armenian potential in Spain: Arman Mayilyan as a guest on the ‘Armenian Diaspora Communities’ program.” Final Results of the 20th Annual International Microelectronics Olympiad AnnouncedUnibank's VISA DIGITAL cards are now free Arca National Payment System, Bank of Georgia and Ameriabank Signed a Memorandum of UnderstandingIdram has been awarded the prestigious “Beyond Payments Awards” by Ant InternationalSTEM Acceleration Award 2025 Held with Idram’s SupportSolar Power is Generated in Kechut Community Through the Efforts of Ucom and SunChild Idram Announces Partnership with WeChat PayAraratBank: Transfer Your Mortgage Loan and Repay It on Attractive Terms: JOIN US“The Power of One Dram” as the Main Supporter of the National Hackathon AI4Biodiversity: AI Solutions for NatureSpeed-Mentoring Event Accelerates Green Innovations within the Ucom Fellowship Program Ucom Supports the Development of High-Tech Education in Armenia Dalan Technopark announces its first bond issuance. Placement Partner is Cube InvestIdram Junior Participants Receive Prizes: The First Junius Financial Literacy Competition ConcludesLusine Yeghiazaryan joins the Board of Trustees of the Music for the Future Foundation5,312,038 AMD for “Symphonic Forest”: the November beneficiary is AI4Biodiversity: AI Solutions for Nature, a national hackathonUcom’s Green Initiative Reaches Urtsadzor AraratBank Honoured with STP Award by Commerzbank AG Compelling Business Loan Offer from AraratBank: JOIN US AraratBank – Title Sponsor of Urartu Football Club The interview of Mher Abrahamyan, Chairman of the Board of IDBank, to Khaleej TimesAmeriabank’s Corporate Loan Portfolio Surpasses AMD 1 Trillion