Hé, Google: Az előzetes AI előadások a gyáva kiút

Szinte minden Big Tech rendezvény manapság magában foglalja a mesterséges intelligencia frissítéseket, gyakran egy pala élő demókkal – és néha ezek a demók kudarcot vallnak. Néhány vállalat azonban elkerüli ezeket a buktatókat azáltal, hogy előzetes előadásukat előzetes előadásukkal állítja elő. És ezeket a mozdulatokat gyávaságnak hívom.
A tavalyi Google Made Event Made -nál Gemini kétszer kudarcot vallott egy élő demonstráció során. Noha az ilyen pillanatok kétségtelenül kínosak a vállalatok számára, hozzáadnak egy olyan hitelességréteget, amelyet nem kapsz egy előre rögzített vitaindító eseményhez. De sajnos a Google a kedd Android Show: I/O Edition előzetes útvonalát választotta. A formátum úgy érezte, hogy túl színpadi és csiszolt volt, hogy tetszésem szerint megszabadította a valóság érzését, amely élő, szemölcsökkel és minden demossal jár.
Az Android Show: I/O kiadás során láttuk, hogy a Gemini megosztási smink tippeket mutatott be, segítve valakinek, hogy találjon időt az ebéd megragadására a forgalmas ütemtervben, és összefoglalva Jane Austen büszkeségét és előítéleteit. Mivel ezek előre rögzített interakciók voltak, Gemini a kéréseket aplomb segítségével kezelte – nincs csuklás vagy kérdés. A tesztek azonban azt mutatják, hogy az AI modellek rendszeresen rosszul vannak a dolgokról.
Az AI tesztelő webhely LiveBench szerint a Google Gemini 2.5 Pro Preview általában az idő kb. 79% -át helyes. Ez nem rossz, de ez sem nagyszerű. És ennek a pontszámnak a ellenére ez a Gemini modellje továbbra is az egyik legjobb AI modell, amelyet a tesztelt hely, és csak két másik modellt veszít el: az Openai O3 High és O4 Medium modellek.
Persze, semmi sem tökéletes, és az eszközöknek és a szoftvereknek hibái vannak. De ha ad nekem egy számológépet, és megígéri, hogy folyamatosan működik, de a valóságban az idő 20% -a rossz, ez jelentős eltérésnek tűnik.
Mivel a Gemini felülmúlta a legtöbb más AI modellt, amelyet a LiveBench tesztelt, nagy esély van arra, hogy továbbra is használom az Ikreket, még akkor is, ha az élő demo megállt. Mivel azonban a Google egy szuperpolied tüntetést választott, nehezen tudom tudni, hogy mit kell hinni.
Nézd, megértem, miért szeretné egy vállalat azt, hogy terméke megfelelően működjön a saját rendezvényén. De az AI eszközök hibájának megmutatása azonban őszintébbnek tűnik, mint a szerszám tökéletes viselkedése. Ezek a képességek hibásak, és ez rendben van, de legyél őszinte az emberekkel azokkal a hibákkal kapcsolatban, és mutassák meg új funkcióit. Ne adj el nekem füstöt és tükröket.
A Google -ról bővebben itt van, mit kell tudni az Android 16 -ról és az Anyag 3 Expressive Design -ről.