Krótkie podsumowanie narzędzi do spotkań opartych na sztucznej inteligencji z transkrypcją w języku niemieckim

Najlepsze narzędzia oparte na sztucznej inteligencji do prowadzenia spotkań w języku niemieckim w 2026 roku to tl;dv, Sembly i HappyScribe, które w kontrolowanym teście dziesięciu narzędzi przeprowadzonym na tym samym niemieckim filmie wideo zajęły ex aequo 48. miejsce na 50.

Każdy z nich zwyciężył w inny sposób: tl;dv transkrypcję i streszczenie w języku niemieckim od początku do końca, Sembly osiągnął najwyższą dokładność surową, a HappyScribe stworzył najszczegółowszy zapis tekstowy.
Osoba, dla której niemiecki jest językiem ojczystym, oceniając każdą transkrypcję „na ślepo” – bez podawania nazw narzędzi – umieściła te same trzy rozwiązania na czołowych miejscach, a Spinach uplasował się tuż obok nich, biorąc pod uwagę wyłącznie jakość surowej transkrypcji.

Różnica między najlepszym a najgorszym wynikiem wyniosła 42 punkty w przypadku tego samego dziewięciominutowego nagrania. Grain 6 Grain , generując fonetyczny bełkot w języku angielskim zamiast niemieckiego. Otter 30 punktów i w jednym z przebiegów całkowicie pominęła ten język bez żadnego ostrzeżenia. Każde z testowanych narzędzi deklaruje na swojej stronie internetowej obsługę języka niemieckiego, więc „obsługuje język niemiecki” i „dobrze radzi sobie z językiem niemieckim” to najwyraźniej nie to samo.

Każdy zapis zweryfikowałem przy pomocy dwóch modeli LLM oraz native speakera języka niemieckiego, który nie widział nazw tych narzędzi.

Podsumowując: jeśli chcesz korzystać z serwisu od początku do końca, wybierz opcję tl;dv”. 

Spis treści

Narzędzia oparte na sztucznej inteligencji przeznaczone do prowadzenia spotkań w języku niemieckim powinny radzić sobie z tym językiem równie dobrze, jak z angielskim. Niezależnie od języka, większość asystentów konferencyjnych opartych na sztucznej inteligencji obiecuje obecnie szeroki zakres możliwości – od rejestrowania spotkań na żywo po generowanie podsumowań opartych na AI i coaching sprzedażowy – a dzięki integracji z platformą MCP możliwości wykorzystania tych treści są niemal nieograniczone. Wszystko to zależy jednak od jednego czynnika.

Dokładność.

Zanim zaczniemy, chcę zaznaczyć, że jestem rodzimym użytkownikiem języka angielskiego. Mówię całkiem nieźle po francusku, ale w przeciwieństwie do wielu członków zespołu tl;dv nie jestem poliglotą. A to ma znaczenie, bo muszę przyznać, że wiąże się z tym pewien przywilej wynikający z bycia rodzimym użytkownikiem języka angielskiego. Kiedy korzystam z oprogramowania, wszystko po prostu „działa”. Wszystko jest dostosowane do mojego języka i zdarza mi się denerwować, gdy pojawia się błąd ortograficzny lub tłumaczenie jest nieco niedokładne.

Mogę sobie tylko wyobrazić, jak to jest, gdy angielski nie jest twoim językiem ojczystym, a tekst, który masz przed sobą, jest po prostu błędny. Nie wspominając już o tym, że w biznesie koszty wynikające z błędnego zapisu lub nieudanego tłumaczenia są bardzo realne.

Z pewną dozą ciekawości, odrobiną niepokoju i z zamiarem obiektywnej oceny postanowiłem przeprowadzić eksperyment. Zdecydowana większość narzędzi AI, które testujemy w serwisie tl;dv , że dysponuje zaawansowanymi umiejętnościami językowymi. Niektóre z nich deklarują nawet obsługę ponad 100 języków. Świat naprawdę zglobalizowany. Ale czy tak jest naprawdę?

Dwóch naszych założycieli pochodzi z Niemiec, nasza siedziba znajduje się w Niemczech, a Niemcy są ważnym ośrodkiem biznesu, handlu i sztucznej inteligencji. Postawiłem więc przed tl;dv jego konkurentami pewne zadanie. Jak dokładne są naprawdę programy do sporządzania notatek oparte na sztucznej inteligencji w języku niemieckim?

Jakie są wyniki? Cóż, są zaskakujące.

Jak zawsze piszę dla tl;dv mi tl;dv to płaci. Jednak wszystko, co przeczytacie dalej, poddałem rygorystycznej weryfikacji przy użyciu wielu modeli językowych (LLM), a nawet poprosiłem o pomoc native speakera języka niemieckiego, który nie ma żadnego tl;dv .

Jak w 2026 roku przetestowałem asystentów AI do prowadzenia spotkań pod kątem dokładności transkrypcji języka niemieckiego

Przetestowałem dziesięć narzędzi do prowadzenia spotkań opartych na sztucznej inteligencji, wykorzystując ten sam dziewięciominutowy film w języku niemieckim – każde z nich trzykrotnie – a następnie oceniłem każdy wygenerowany zapis według ustalonej 50-punktowej skali, uwzględniającej dokładność, jakość w kontekście języka niemieckiego, wydajność oraz niezawodność.

Myślę, że wszyscy zgodzimy się, niezależnie od tego, jakim językiem się posługujemy, że „poprawny” język to mit. Ludzie mówią i piszą na różne sposoby. Język, którego nauczyłeś się w szkole, NIE jest tym samym językiem, którym posługujesz się na co dzień. Dowodem na to był mój ustny egzamin z francuskiego na GCSE; obniżono mi ocenę za zbyt częste używanie slangu.

W każdym razie, po założeniu metaforycznego białego fartucha i przygotowaniu warunków kontrolnych nadszedł czas na przeprowadzenie eksperymentu.

Wybrane przeze mnie źródło musiało być wymagające. Nie mogło to być coś w stylu „naucz się niemieckiego na łatwo”, ponieważ a) było to zbyt proste, b) wpadło w pułapkę „poprawnego” niemieckiego, a nie tego, jak ludzie naprawdę mówią.

Zdecydowałem się na filmik z serii „Kurzgesagt” – dziewięć minut i czterdzieści trzy sekundy szybkiej, technicznej narracji, pełnej złożonych słów, z których słynie język niemiecki. Już sama nazwa jest pułapką. „Kurzgesagt” to jedno słowo, ale jest to połączenie wyrażenia „kurz gesagt” (krótko mówiąc), więc każde narzędzie, które rozdzieli je z powrotem na dwie części, zdradza się, zanim zdążysz przeczytać kolejną linijkę.

To sprawia, że jest to najszybszy test w całym eksperymencie. Jeśli pozostawisz „Kurzgesagt” jako jedno słowo, udowodnisz jednym słowem, że rozumiesz język niemiecki, a nie zgadujesz. Jeśli podzielisz je na „kurz gesagt”, udowodnisz coś zupełnie przeciwnego. Jedno słowo – natychmiastowa ocena, czy narzędzie faktycznie rozumie język, czy tylko próbuje go odgadnąć.

Dodatkowa zaleta? Dostępna była również angielska wersja tego samego filmu, co dało mi jasny punkt odniesienia na wypadek, gdyby okazało się to potrzebne.

Narzędzia do spotkań oparte na sztucznej inteligencji, które przetestowałem

Dziesięć narzędzi, w kolejności losowej:

  1. tl;dv
  2. Fathom
  3. Fireflies
  4. Zgromadzenie
  5. Jamie
  6. HappyScribe
  7. Otter
  8. MeetGeek
  9. Grain
  10. Szpinak

Niektóre z nich omówiliśmy lub opisaliśmy bardziej szczegółowo w innych miejscach, więc jeśli dostępny jest link do bardziej szczegółowego artykułu, znajdziesz go powyżej.

Dlaczego trzy rundy?

Po trzy przejścia, w sumie trzydzieści ujęć. I krótka uwaga na temat tego, dlaczego akurat trzy: mógłbym powiedzieć, że starałem się być dokładny – i rzeczywiście tak było – ale także dlatego, że pierwsze przejście służyło mi jako nauka.

W pierwszej rundzie nagrałem wszystkich asystentów narad jednocześnie, gdy wszyscy uczestniczyli w tym samym spotkaniu.

To był kiepski pomysł.

Przeprowadź test 1, sprawdzając wszystkie boty w języku niemieckim
Czysty chaos

Boty wchodziły sobie w drogę, walczyły o dostęp do dźwięku, a niektóre z nagrań były chaotyczne i niespójne. Nie wszystkie, ale do tego wrócę w podsumowaniu wyników. Zrezygnowałem więc z tego podejścia w kolejnych dwóch seriach.

W rezultacie przebieg nr 2 stał się głównym przebiegiem punktowym, a każde narzędzie zostało zarejestrowane w osobnej sesji, bez obecności innych botów w pomieszczeniu. Przebieg nr 3 służył sprawdzeniu spójności wyników. Jeśli narzędzie raz osiągnęło doskonały wynik, a dwa razy popełniło błąd, to mówi to więcej niż pojedynczy szczęśliwy wynik.

A propos, warto pamiętać o tym pierwszym nieudanym podejściu. Jeśli kiedykolwiek próbowałeś zgromadzić trzech notujących na jednym spotkaniu, wiesz, że nie zawsze potrafią się dobrze dogadać.

Kilka słów o ograniczeniach tego testu

Działałem w dobrej wierze i starałem się kontrolować to, co było w mojej mocy.

Ten sam materiał wideo, te same warunki wyjściowe; każde narzędzie zostało zarejestrowane w osobnej sesji na potrzeby oceny wstępnej.

Chcę jednak szczerze powiedzieć, czego taki test może ci powiedzieć, a czego nie.

Narzędzia te działają na dźwięku na żywo w rzeczywistych warunkach, a warunki te ulegają zmianom. Przerwy w połączeniu sieciowym, nieznacznie odmienna ścieżka dźwiękowa, model zaktualizowany po cichu po stronie dostawcy, obciążenie serwera o porze dnia, w której akurat uruchomiłem narzędzie – każdy z tych czynników może wpłynąć na wynik. Narzędzie, które zawiodło podczas moich testów, może świetnie sprawdzić się w Twoim przypadku, a narzędzie, które świetnie poradziło sobie u mnie, może mieć gorszy dzień u Ciebie. Taka jest natura zamiany mowy na tekst w 2026 roku. Wynik jest probabilistyczny i ulega zmianom.

Potraktujcie więc to, co nastąpi , jako wyraźny sygnał, a nie gwarancję. Powodem, dla którego przeprowadziłem trzy serie testów zamiast jednej, było właśnie to: na wzór powtarzający się w każdej serii postawiłbym, podczas gdy pojedynczy dobry lub zły wynik traktowałbym z większym dystansem. Oznaczyłem te jednorazowe przypadki tam, gdzie się pojawiły, abyście mogli odróżnić wyniki stałe od tych wynikających ze szczęścia lub pecha.

Najważniejsze nie jest żadna konkretna ocena. Chodzi o to, żebyś sam przetestował to na własnych nagraniach w języku niemieckim, zanim powierzy mu coś naprawdę ważnego. Moje dziewięć minut to przydatna wskazówka. Twoje spotkanie będzie prawdziwym sprawdzianem.

Wyniki: oceny dziesięciu narzędzi w zakresie transkrypcji języka niemieckiego

Przeprowadziłem testy i oto wyniki oceny modeli LLM. Trzy narzędzia zajęły ex aequo pierwsze miejsce, uzyskując 48 na 50 punktów: tl;dv, Sembly i HappyScribe. Grain na ostatnim miejscu z wynikiem 6 punktów.

Pełne zestawienie znajduje się poniżej.

RankingNarzędzieDokładność /20niemiecki /15Wynik /9Niezawodność /6Razem /50Werdykt
1tl;dv18159648Najwyższa klasa
1Zgromadzenie19158648Najwyższa klasa
1HappyScribe18159648Najwyższa klasa
4Fathom17129644Silny
5Jamie17118642Silny
6Szpinak15118640Solidny
7Fireflies1598335Niespójne
7MeetGeek14108335Niespójne
9Otter1198230Niewiarygodny
10Grain00066Nie powiodło się

Choć miałem wielką nadzieję, że tl;dv z powierzchni ziemi całą konkurencję i odniesie zdecydowane zwycięstwo, tak się nie stało.

Wynik był jednak remisowy na szczycie rankingu. Każda z tych trzech aplikacji wypadła najlepiej w nieco innym obszarze. Sembly okazało się „najlepsze” pod względem czystej dokładności, uzyskując 19 na 20 punktów, natomiast tl;dv HappyScribe z łatwością dorównały mu w zakresie obsługi języka niemieckiego, którą właśnie miało sprawdzić całe badanie.

Następnie nastąpił wyraźny spadek o cztery punkty w przypadku Fathom – naprawdę solidnego narzędzia, które po prostu nie radziło sobie z niemieckimi wyrazami złożonymi i nazwami własnymi.

Poniżej pierwszej czwórki poziom gwałtownie spada. Ale oto najciekawsze. Czterdzieści dwa punkty dzieliły najlepsze narzędzie od najgorszego – przy tym samym dziewięciominutowym filmie i w tym samym języku. Okazuje się, że stwierdzenia „obsługuje język niemiecki” i „dobrze radzi sobie z językiem niemieckim” to dwie zupełnie różne rzeczy.

Zanim przeprowadziłem choćby jeden test, upewniłem się, że sprawdzam narzędzia, które rzeczywiście mogą to potwierdzić. Poniżej przedstawiam, co każde z tych narzędzi pisze na swojej stronie internetowej na temat języka niemieckiego.

NarzędzieTwierdzi, że ma poparcie Niemiec?
tl;dvTak. Niemiecki jest jednym z ponad 40 języków obsługiwanych przez platformę, a sama platforma jest dostępna w języku niemieckim.
FathomTak. Język niemiecki znajduje się wśród 38 języków, a streszczenia są tłumaczone automatycznie na niemiecki.
FirefliesTak. Posiada specjalną stronę poświęconą transkrypcji języka niemieckiego, która zapewnia ponad 90-procentową dokładność.
ZgromadzenieTak. Język niemiecki jest dostępny na wszystkich stronach w różnych językach.
JamieTak. Firma założona w Niemczech, notowana na niemieckiej giełdzie, obsługująca ponad 100 języków.
HappyScribeTak. Specjalne strony poświęcone transkrypcji języka niemieckiego i szwajcarskiego niemieckiego.
OtterTak. W centrum pomocy niemiecki figuruje jako jeden z obsługiwanych języków transkrypcji.
MeetGeekTak. Język niemiecki jest dostępny w centrum pomocy, aplikacjach i API.
GrainTak. Język niemiecki znalazł się w najwyższej kategorii dokładności „Powszechne”.
SzpinakTak. Notowana na niemieckiej giełdzie; obsługuje ponad 100 języków.

Każde z wybranych narzędzi wyraźnie zaznacza na swojej stronie, że oferuje transkrypcję z języka niemieckiego.

Chciałbym tylko, żebyś o tym pamiętał.

Najpierw zapytaliśmy sztuczną inteligencję, a potem człowieka

To całkiem interesujący zestaw danych, z czym zapewne się zgodzisz, ale pewnie zastanawiasz się:

„Ale Dani, przecież nie znasz niemieckiego? Jak więc zorientowałaś się, co jest prawdą, a co nie?”

Cieszę się, że o to pytasz. I szczerze mówiąc, brak znajomości języka niemieckiego wiązał się z pewnymi ograniczeniami. Nie mogłem po prostu posłuchać, przeczytać tekstu i stwierdzić: „och, to jest błędne”. Ale pozwoliło mi to też spojrzeć na to z pewnym pożytecznym dystansem. Nie miałem słuchu, na którym mógłbym polegać, ani instynktu, który mógłbym wykorzystać, więc musiałem zamiast tego opracować własną metodę.

Tak przy okazji, osobiście uważam, że niemiecki to naprawdę trudny język. Moja mama była poliglotką. Znała francuski, arabski, a nawet grecki, oprócz angielskiego. Niemiecki był jedynym językiem, który sprawiał jej trudności, właśnie dlatego, że różnice regionalne i akcenty mogły całkowicie zmienić znaczenie. Dzisiaj jest to mniej odczuwalne, w świecie tak połączonym, że wiele regionalnych niuansów ulega zatarciu, ale różnice nadal istnieją.

Skoro więc sam nie potrafiłem ocenić tego niemieckiego, potrzebowałem sędziów, którzy by to potrafili. Skorzystałem z pomocy trzech.

Najpierw zwróciłem się do sztucznej inteligencji. Za pomocą Claude’a oceniłem każdy zapis rozmowy według mojej siatki ocen, a następnie przeprowadziłem drugą analizę przy pomocy ChatGPT. Starałem się oddzielić te zapisy od siebie i zapewnić ich obiektywność; jak bardzo są one obiektywne, tego dziś nikt nie wie, ale wyraźnie poprosiłem o neutralny, bezstronny wynik. Co ciekawe, wyniki tych dwóch systemów nie były ze sobą w pełni zgodne.

Claude przeprowadził pierwszą rygorystyczną ocenę, ściśle trzymając się 50-punktowej siatki ocenowej, a fragmenty testowe zostały ustalone przed rozpoczęciem punktacji. Nie zapewniło to tl;dv zdecydowanego tl;dv . W rezultacie tl;dv znalazło się na pierwszym miejscu tl;dv z Sembly i HappyScribe. Remis, a nie zwycięstwo.

ChatGPT miało z tym trochę kłopotów, prawdopodobnie dlatego, że niedawno anulowałem subskrypcję, więc było na mnie trochę urażone. Kiedy w końcu udało mi się skłonić je do przeczytania całego surowego tekstu, ogłosiło, że tl;dv zdecydowanym zwycięzcą. Byłem nieco podejrzliwy, więc naciskałem i prosiłem, żeby był całkowicie neutralny, bezstronny i nie chronił moich uczuć, ale był dość pewny siebie. No cóż, przyjmujemy to, ale było to o wiele mniej dokładne niż w przypadku Claude'a.

W końcu poprosiłem o pomoc człowieka. Dwie sztuczne inteligencje działające na podstawie moich wytycznych nadal nie potrafią sprawdzić pracy domowej mojego klienta, więc poprosiłem o pomoc native speakera języka niemieckiego, który nie miał żadnego tl;dv , nie znał treści poszczególnych transkrypcji i nie miał powodu, by przejmować się tym, jak wypadnie ocena.

Po tym, jak powiedziała mi, że„zaczęłyjejkrwawić oczy”po przeczytaniu wszystkich wyników, wyraziła się dość dosadnie i przedstawiła miażdżącą opinię na temat niektórych zanonimizowanych wyników. Jej opinia zasadniczo pokrywała się z ocenami modelu LLM, z jednym uderzającym wyjątkiem, do którego jeszcze wrócę.

O tym, co faktycznie wychwyciła – o konkretnych niemieckich wpadkach i o jednej rzeczy, która mnie naprawdę zaskoczyła – opowiem nieco później.

Narzędzie po narzędziu: jak poszczególne narzędzia wypadły w niemieckim teście LLM

Nie zamierzam po prostu podać wam liczb i na tym poprzestać. Oto bardziej szczegółowe zestawienie ocen, jakie przyznał mi każdy z sędziów LLM dla poszczególnych narzędzi. To, co dobre, to, co złe, i to, co budzi pytanie: „Co tu się właściwie dzieje?”.

Krótka uwaga dotycząca sposobu czytania tego tekstu. Wyróżniłem najważniejsze elementy każdego z nich, a jedną z ciekawych rzeczy, na które warto zwrócić uwagę, było nie tylko to, jak dobrze narzędzie poradziło sobie z samą transkrypcją, ale także sposób, w jaki ją przedstawiło. Zauważyłem kilka znaczących odstępstw od normy, w których narzędzie całkiem nieźle poradziło sobie z transkrypcją, a następnie wygenerowało streszczenie lub wiadomość e-mail w języku angielskim.

1) tl;dv – transkrypcja tl;dv

tl;dv jedynym narzędziem, które od początku do końca zachowało niemiecki język. Transkrypcja, pulpit nawigacyjny i podsumowanie wysłane e-mailem zostały dostarczone w języku, w którym faktycznie odbyło się spotkanie. Nie doszło do cichego przełączenia na angielski na etapie podsumowania, czego – jak się przekonacie – nie udało się osiągnąć kilku innym narzędziom.

Sam zapis był przejrzysty i poprawnie interpunkcyjnie, a złożone wyrażenia oraz termin „Kurzgesagt” zostały przetłumaczone bez żadnych problemów. Streszczenie miało przejrzystą strukturę, a nie było po prostu długim blokiem tekstu, co ma znaczenie, gdy przegląda się podsumowanie, a nie czyta transkrypcję wiersz po wierszu.

Jedyna stała wpadka: „AI-Slop” – kluczowe wyrażenie w filmiku – za każdym razem wychodziło jako „AI-Slog”. Nie była to wpadka typowa dla języka niemieckiego, a raczej potknięcie związane z zapożyczeniem z angielskiego, ale za każdym razem – trzy razy z rzędu – wynik był niezmiennie błędny.

Chciałbym tu dodać jeszcze jedno małe zastrzeżenie. Pracując dla tl;dv dostęp do konta na poziomie Business. Co to oznacza? Oznacza to, że nie napotykam żadnych ograniczeń w zakresie transkrypcji ani żadnych innych funkcji dostępnych wyłącznie w ramach płatnej subskrypcji. Wiele z poniższych narzędzi przetestowałem w ramach bezpłatnej wersji próbnej, która oferowała ten sam zakres funkcjonalności. Więc podczas drugiego testu tl;dv konta Free, niepowiązanego z moim tl;dv. Zrobiłem to celowo, żeby mój poziom dostępu nie dał mi lepszego wyniku. Efekt? Dostałem krótszy wynik transkrypcji, ale nadal był on dokładny w języku niemieckim, co jasno pokazuje, że nawet na poziomie Free jakość transkrypcji się utrzymała.

Wynik? Niezawodne i wydajne narzędzie – jedyne, które nie zmusiłoby mnie do zmiany języka, by móc odczytać własne wyniki.

2) Transkrypcja niemiecka Sembly

Sembly uzyskało najlepszy wynik w kategorii transkrypcji w całym teście – 19 na 20 punktów. Według modeli LLM była to najdokładniejsza, słowo w słowo, transkrypcja tekstu niemieckiego, wyprzedzająca nawet współzwycięzców, z którymi zremisowało w klasyfikacji ogólnej.

Dwie wpadki sprawiły, że nie wyszło to tak, jak powinno. Po pierwsze, e-mail z podsumowaniem przyszedł po angielsku, mimo że spotkanie odbyło się w języku niemieckim – dokładnie ta sama wpadka z dostarczeniem wiadomości w niewłaściwym języku, o której wspomniałem na początku. Po drugie, co jest jeszcze dziwniejsze, w wersji 2 ocenzurowano słowo „Mist”. Dla osób mówiących po niemiecku jest to łagodne słowo, zbliżone znaczeniem do „bzdura” lub „cholera”. Sembly i tak je zamazało, zastępując je „****”, co oznacza, że filtr wulgaryzmów zadziałał w przypadku słowa, które prawdopodobnie tego nie wymagało.

Wynik? Jeśli najważniejsza jest dla Ciebie sama dokładność transkrypcji, to Sembly jest prawdopodobnie najlepszym wyborem. Pamiętaj tylko, że podsumowanie może być sporządzone w języku innym niż ten, w którym odbyło się spotkanie.

3) Transkrypcja niemiecka HappyScribe

HappyScribe okazało się narzędziem, które ani razu nie wpadło w tę pułapkę. Wyrażenie „Kurzgesagt” we wszystkich trzech przebiegach zostało przetworzone jako jedno słowo, podczas gdy większość konkurencyjnych narzędzi przynajmniej raz podzieliła je na „kurz gesagt”. Ponadto narzędzie to wygenerowało jedno z najgłębszych i najbardziej szczegółowych streszczeń spośród wszystkich testowanych narzędzi, zawierające przejrzyste oznaczenia czasowe i identyfikatory mówców w całym tekście.

Jest ku temu powód: firma HappyScribe rozpoczęła działalność od produktu skupionego na transkrypcji. Usługi asystenta spotkań stanowią uzupełnienie podstawowej działalności, której sednem jest przekształcanie nagrań audio w dokładny tekst, w tym dedykowana usługa transkrypcji w języku niemieckim, a nawet w szwajcarskim dialekcie niemieckim. Tak wysoka jakość obsługi języka niemieckiego nie jest więc szczęśliwym zbiegiem okoliczności; to właśnie w tym celu powstała ta firma.

Wynik? Jeśli priorytetem jest dla Ciebie sam zapis, transkrypcja i dokładne podsumowanie, a nie dodatki związane z samym spotkaniem na żywo, HappyScribe jest trudny do przebicia.

4) Transkrypcja Fathom

Fathom naprawdę solidne narzędzie, które uplasowało się tuż za pierwszą trójką, tracąc cztery punkty i uzyskując wynik 44. Jakość transkrypcji była dobra, choć nie należała do najlepszych, jednak największe atuty tego narzędzia ujawniły się w zakresie generowanych wyników. Uzyskało ono maksymalną ocenę 9 na 9 za jakość streszczenia, przekształcając nieco słabszy materiał źródłowy w przejrzyste i przydatne podsumowanie.

Słabym punktem okazało się jednak radzenie sobie z specyficznymi dla języka niemieckiego zwrotami. System pomylił się przy wymawianiu słowa „Kurzgesagt” na zakończenie i miał trudności z kilkoma wyrazami złożonymi oraz nazwami własnymi, z którymi trzy najlepsze systemy poradziły sobie bezbłędnie.

Wynik? Solidny wszechstronny gracz i dowód na to, że świetne podsumowanie może zamaskować jedynie przeciętny przebieg gry, ale nie jest to jeszcze prawdziwy specjalista od niemieckiej gry.

5) Transkrypcja tekstu piosenki „Jamie German”

Jamie był właściwie tym narzędziem, które moim zdaniem mogło stanowić dla nas największą konkurencję. To firma z siedzibą w Niemczech… Jest bardzo niemiecka.

Ogólnie rzecz biorąc, narzędzie sprawdziło się, plasując się solidnie w środku stawki z wynikiem 42 punktów. Dobrze poradziło sobie z trudniejszymi fragmentami, w tym z wykryciem ukrytego tekstu z filmu z lipca 2025 r., co sprawiło kłopoty słabszym narzędziom.

Dwie flagi. Liczby wyświetlał w postaci słownej zamiast cyfr – „zweitausendfünfundzwanzig” zamiast 2025 – co technicznie nie jest błędem, ale utrudnia skanowanie. W przebiegu 1 wystąpił też najdziwniejszy błąd liczbowy w całym teście: wartość „72%” z filmu została zamieniona na „270%”.

Wynik? Solidna opcja, w której priorytetem jest ochrona prywatności i która w większości przypadków wykorzystuje przewagę własnego boiska. Dużym problemem są jednak błędy w numerach. 

6) Transkrypcja niemieckiej wersji utworu „Spinach”

Spinach przetłumaczył tekst z niemieckiego dość poprawnie, choć według modeli LLM nie tak dobrze jak inne rozwiązania (warto o tym pamiętać!), uzyskując wynik 40 punktów i zachowując poprawne znaczniki czasowe w każdym wierszu. Jednak za każdym razem podsumowanie pojawiało się w języku angielskim. Na wejściu niemiecki tekst, na wyjściu angielskie podsumowanie – trzy razy z rzędu.

Podobnie jak kilka innych, również ta wersja natknęła się na angielski zapożyczenie „AI-Slop”, tłumacząc je w poszczególnych wydaniach na różne sposoby, np. jako „AI-Slob” czy „AI-Slot”. Nie jest to bynajmniej wada języka niemieckiego jako takiego, a raczej pewna niepewność w odniesieniu do zapożyczonego terminu angielskiego w kontekście języka niemieckiego.

Wynik? Samo nagranie jest w porządku, ale angielskie streszczenia utrudniają sprzedaż tego rozwiązania zespołom niemieckojęzycznym, które chcą otrzymywać podsumowania w swoim języku.

7) Transkrypcja Fireflies

Fireflies najlepszy dowód na to, dlaczego zrezygnowałem z nagrywania wszystkiego naraz. W pierwszej próbie, kiedy wszystkie boty były upchnięte na jednym spotkaniu, niemiecki wyszedł mocno zniekształcony. Druga próba, nagrana osobno, była znacznie czystsza i zdecydowanie najlepsza. Natomiast w trzeciej próbie znów pojawiły się zniekształcenia.

To właśnie ta zmienność sprawiła, że narzędzie uzyskało niską ocenę pod względem niezawodności. Trudno polegać na narzędziu, które do działania wymaga idealnie cichego pomieszczenia, w którym znajduje się tylko jeden bot, ponieważ prawdziwe spotkania rzadko tak wyglądają. W jednym z podsumowań narzędzie to zamieniło również słowo „Bots” na „Sport”, co wiele mówi o jakości nagrania, na podstawie którego pracowało.

Wynik? Sprawdzi się, gdy warunki są idealne, ale zawodzi, gdy tak nie jest.

8) Transkrypcja niemiecka MeetGeek

Największym problemem serwisu MeetGeek był „Run 1”, w którym całe niemieckie nagranie wideo zostało przetworzone na język angielski. Nie chodziło o tłumaczenie, lecz o transkrypcję fonetyczną – angielskie przybliżenie tego, co usłyszał program, co stanowi osobny rodzaj błędu. Wynik brzmiał mniej więcej tak: „AI.S.Mob, overfluted the net”.

Błąd w niemieckiej transkrypcji serwisu MeetGeek
Wpadka MeetGeek przy transkrypcji z języka niemieckiego

Wersje 2 i 3 przywróciły prawdziwy, użyteczny niemiecki, ale w obu przypadkach początkowa część została ucięta, przez co brakuje samego początku filmu.

Wynik? Dwa niezłe przejazdy na trzy, zepsute przez całkowitą porażkę językową w pierwszym i nieudane otwarcia w pozostałych.

9) Transkrypcja Otter

Po pierwszym uruchomieniu wróciłem nawet, żeby sprawdzić, czy Otter obsługuje język niemiecki. Wynik był tak daleki od rzeczywistości – zamiast niemieckiego tekstu pojawiła się angielska papka fonetyczna, a jednym z fragmentów było zdanie „We’re a ice lot to again height” – że szczerze sądziłem, iż popełniłem błąd i wybrałem narzędzie przeznaczone wyłącznie do języka angielskiego. Tak jednak nie było. Centrum pomocy Otterwyraźnie wymienia język niemiecki, a ja wybrałem go poprawnie. Narzędzie po prostu tak bardzo zawiodło.

Otter z transkrypcją niemiecką
Podczas pierwszego uruchomienia Otter wpadłem w panikę na widok tych wszystkich botów w języku angielskim

Pozostałe uruchomienia generowały tekst w języku niemieckim – wprawdzie pomieszany, ale rozpoznawalny jako niemiecki – co w pewnym sensie pogarsza sprawę. Narzędzie, które pomija wybrany język bez ostrzeżenia, błędu czy flagi, jest trudniejsze do zaufania niż takie, które jest po prostu kiepskie, ponieważ nie da się tego wychwycić, chyba że znasz ten język i uważnie obserwujesz. Zniekształciło ono również kluczową statystykę filmu, zamieniając „ponad 1200” na zniekształcone „eins 200”.

Wynik? Obiecuje wsparcie w języku niemieckim, czasami je zapewnia, a czasami rezygnuje z niego bez uprzedzenia. Proszę więc podchodzić do tego z odpowiednim dystansem.

10) Transkrypcja Grain

Po prostu… wow! Grain od samego początku Grain dostarczył mi nawet porządnego zapisu. Podczas gdy inne narzędzia generowały przynajmniej jakiś tekst w języku niemieckim – dobry, zły czy chaotyczny – Grain tak mało użytecznego tekstu, że przy jednym z uruchomień poinformował mnie, że „nie ma treści, na podstawie której można by wygenerować notatki”. Nie był w stanie sporządzić podsumowania spotkania, ponieważ nie udało mu się go transkrybować.

Wynikiem wszystkich trzech przebiegów nie był niemiecki, ani nawet kiepski niemiecki. Była to fonetyczna angielska bełkot. „Google AI fast website Suzanne” to prawdziwy fragment, który wygenerowało na podstawie niemieckiego nagrania. Nazwało swoje sesje nagraniowe na cześć tego bełkotu, więc ten nonsens przeniknął również do nazw plików.

Na stronie pomocy Grainjęzyk niemiecki jest wymieniony nie tylko jako obsługiwany, ale także zaliczony do najwyższego poziomu dokładności „Common” – poziomu, który serwis opisuje jako wyjątkowo dokładny pod względem rozpoznawania słów, znaków interpunkcyjnych i nazw własnych.

Wynik? Różnica między tym, co obiecano, a tym, co otrzymałem, jest największa ze wszystkich testów. W tym nagraniu Grain nie Grain transkrybować niemieckiego. Wymyślił sobie angielski i poddał się.

Podsumowania spotkań Grain
Jakie Grain się na liście uczestników spotkania
Podsumowanie Grain
„Podsumowanie” Grain

Co nasz niemieckojęzyczny rozmówca sądził o tych wynikach?

Modele LLM przedstawiły więc dość szczegółową analizę wyników poszczególnych narzędzi w odniesieniu do kryteriów oceny. Jest tu jednak pewien niuans. Film został wybrany tak, by odzwierciedlał rzeczywiste spotkanie: hałas w tle, mówiący w szybkim tempie, warunki, które nigdy nie są idealne. Wynik w skali do pięćdziesięciu to jedno.

To już inna sprawa, jak oceni ten tekst osoba, która faktycznie posługuje się tym językiem.

W tej części testu przesłałem naszej niemieckojęzycznej recenzentce surowy dokument zawierający wyniki transkrypcji, z którego usunąłem wszystkie nazwy narzędzi. Żadnych oznaczeń, żadnych ocen – nie miała pojęcia, które z nich to tl;dv które nie przeszły testu. Poprosiłem ją, by oceniła dokładność każdego z nich w skali od 1 do 10 i podzieliła się ze mną swoimi szczerymi uwagami.

Wyniki były całkiem zabawne. Były też bardziej wymowne niż jakiekolwiek oceny, które im wystawiłem. Oto, jak naprawdę wyglądał niemiecki po przejściu przez ten proces.

Cztery narzędzia wypadły znakomicie. HappyScribe, tl;dv, Sembly i Spinach znalazły się w jej najwyższym przedziale punktowym, głównie z ocenami 9 i 10; zdanie po zdaniu uznawane było za poprawne, a na marginesie prawie nie było żadnych uwag. Trzech z tych czterech spodziewałem się. Były to te same nazwy, które zajmowały czołowe miejsca w mojej pięćdziesięciopunktowej skali ocen. Ale Spinach? To był najciekawszy wynik w całym tym teście.

W środkowej części było podobnie – Jamie utrzymał poziom, zdobywając oceny 8 i 9, a punkty stracił głównie za to, że zamienił „72 procent” na „zweihundsiebzig procent”.

Fathom bardziej chaotycznie. Jej oceny wahały się od 3 do 10 w zależności od zdania, a margines zapełniał się komentarzami: „to nie jest słowo”, „kim jest ta »ona«?”, „ostatnie zdanie jest dziwne”. W pewnym momencie Fathom swoją nazwę do transkrypcji: „Der Fathom Menschen für Menschen gemacht”, co wywołało zdziwienie: „czy »kurz gesagt« to nazwa oprogramowania? czy co to ma znaczyć?”.

A potem przyszła kolej na pozostałych. Otter, MeetGeek, Fireflies Grain , przy których wyraźnie zabrakło jej cierpliwości, co widać w notatkach. Otter surową ocenę: „zbyt wiele błędów i półangielskie słowa”, a przy kolejnym podejściu – 1/10 z komentarzem: „poza tym to po prostu bełkot złożony z przypadkowych słów”; przy trzecim podejściu całkowicie zrezygnował z niemieckiego i powrócił do łamanego angielskiego. Fireflies „większość to po prostu bełkot”. MeetGeek rozpłynęło się w pętli „przepraszam, przepraszam, przepraszam”. Grain ogóle Grain wygenerowało niemieckiego. Wygenerowało coś fonetycznego i przypominającego angielski, co naprawdę trudno było przeczytać na głos bez śmiechu.

Nie umieściła tl;dv . HappyScribe i Spinach znalazły się tuż obok niego. Narzędzie, dla którego piszę, wypadło w teście ślepym bez zarzutu, uzyskując wyniki 9, 8 i 9 w poszczególnych rundach, bez żadnych uwag na marginesie, ale nie okazało się zdecydowanym zwycięzcą. Właśnie tego oczekiwałem od tej części testu. Sędzia, który nie widzi logo, nie może mi wyświadczyć żadnej przysługi.

A teraz szpinak.

W mojej 50-punktowej skali ocen „Spinach” uplasował się w środku tabeli. W jej ślepej ocenie znalazł się wśród zwycięzców. Ta rozbieżność nie wynika z błędu, ale warto ją dokładnie wyjaśnić.

Spinach znakomicie transkrybuje autentyczną mowę niemiecką, ale potem praktycznie nic z tym nie robi. Przy każdym uruchomieniu program czysto rejestrował dźwięk, a następnie generował streszczenie w języku angielskim. Moja matryca oceniała cały produkt – transkrypcję, streszczenie oraz sposób prezentacji – tak jak oceniłaby to niemiecka ekipa, która faktycznie otworzyłaby ten plik w poniedziałkowy poranek, więc Spinach traciła punkty we wszystkich kategoriach, których ona nigdy nie brała pod uwagę. Ona patrzyła wyłącznie na surowy tekst. A surowy tekst był znakomity.

Otrzymujemy więc dwie różne oceny tego samego narzędzia. Jeśli spojrzeć wyłącznie na transkrypcję, Spinach jest niemal bezbłędny. Jeśli jednak oceniać go jako narzędzie, którego faktycznie używałbyś do obsługi niemieckich spotkań, jego ocena spada do średniej. To samo oprogramowanie, dwie różne oceny – wszystko zależy wyłącznie od tego, co zdecydujesz się mierzyć.

Grain to z jednej strony: jeśli nie opanujesz transkrypcji, zawalisz wszystko, co będzie dalej. Serial „Spinach” pokazuje to z drugiej strony: nawet jeśli opanujesz transkrypcję, nadal możesz nie dać rady jako niemiecki tłumacz.

Poniżej możesz zobaczyć kilka zabawnych, spontanicznych komentarzy naszego niemieckojęzycznego lektora na temat transkrypcji. 

„To mnie trochę brzydzi”
„Czy to na poważnie?”
„No cóż, to wszystko po angielsku”
„Większość tego to bełkot”
„po prostu niemieckie słowa mylnie odbierane jako angielskie”

Dlaczego Niemcy złamali tak wiele z nich

Oto pytanie, które nasuwa się po zapoznaniu się z wynikami. Skoro wszystkie dziesięć narzędzi rozpoznaje język niemiecki, a niemiecki nie jest bynajmniej językiem mało znanym – jest to jeden z najczęściej używanych języków ojczystych w Europie – to skąd bierze się 42-punktowa różnica w wynikach dla tego samego dziewięciominutowego filmu? Częściową odpowiedzią jest silnik, na którym opiera się każde z tych narzędzi.
Narzędzie Silnik transkrypcji Deklarowana dokładność dla języka niemieckiego
tl;dv Domyślnie model zastrzeżony, z funkcją Whisper w planach Business i Enterprise Brak danych dotyczących języka niemieckiego. tl;dv ogólną dokładność na poziomie 96%, bez podziału na poszczególne języki.
Zgromadzenie Deepgram Nie opublikowano danych dotyczących wyłącznie Niemiec.
HappyScribe Własny model opracowany przez naszą firmę ~85% w przypadku tłumaczenia niemieckiego przez sztuczną inteligencję, do 99% po weryfikacji przez tłumacza. Tak podaje sama firma na swojej niemieckiej stronie.
Fathom Nie podano do wiadomości publicznej Nie ma danych dotyczących konkretnie Niemiec. Ogólnie szacuje się, że około 95%.
Jamie ElevenLabs Scribe Brak danych dotyczących konkretnie Niemiec. Wyniki są „bardzo dokładne” w ponad 100 językach.
Szpinak Nie podano do wiadomości publicznej Nie podano danych dotyczących dokładności.
Fireflies AssemblyAI Nie opublikowano danych dotyczących wyłącznie Niemiec.
MeetGeek Własny (niedawno zmodernizowany silnik) Nie opublikowano danych dotyczących wyłącznie Niemiec.
Otter Własny model opracowany wewnętrznie (AISense) Brak danych dotyczących rynku niemieckiego. Produkt jest skierowany przede wszystkim na rynek anglojęzyczny, a wsparcie w języku niemieckim jest ograniczone.
Grain AssemblyAI Nie podano danych dotyczących dokładności.
Zanim jednak zaczniesz doszukiwać się w tym artykule zbyt wielu znaczeń, musisz zrozumieć jedną rzecz. Silnik to surowiec, a nie gotowy produkt. Każde z tych narzędzi wykorzystuje ten sam podstawowy model językowy, ale konfiguruje go na własną rękę: określa, jak wykrywać język, jak dostosować go do akcentów, jakie przetwarzanie końcowe oczyszcza wynik, czy jest zoptymalizowane pod kątem wszechstronności, czy przede wszystkim pod kątem języka angielskiego. Dlatego dwa narzędzia mogą działać na tym samym silniku, a mimo to dawać zupełnie odmienne wyniki. Spójrzmy na Grain Fireflies. Oba działają na AssemblyAI. Grain wynik 6 i wygenerował bełkot w języku angielskim. Fireflies wynik 35. Ten sam silnik, a między nimi różnica dwudziestu dziewięciu punktów. Mechanizm był identyczny. To, co każda z firm z nim zrobiła, już nie.

Czy to wynika z lokalizacji?

W tym momencie zatrzymałem się na chwilę, by zastanowić się, czy miejsce siedziby tych firm miało na to jakiś wpływ. Ponownie, kierując się tym „przywilejem znajomości języka angielskiego”, zacząłem się zastanawiać, czy narzędzia osiągające najlepsze wyniki pochodzą wyłącznie z Europy, a te, które wypadły słabo, z USA. Prywatność i bezpieczeństwo są to z pewnością obszary, w których zazwyczaj dostrzegamy różnice między narzędziami amerykańskimi a europejskimi, ale w tym przypadku tak nie było. Dwa z trzech najpopularniejszych narzędzi to europejskie serwisy tl;dv HappyScribe, i oba narzędzia niemieckiej produkcji, tl;dv Jamie, sprawdziły się. Na pierwszy rzut oka teoria wydawała się więc sensowna. Szybko jednak się rozpadła. Sembly to firma amerykańskaz siedzibą w Nowym Jorku, która osiągnęła najwyższy wynik pod względem dokładności w całym teście. MeetGeek to europejska firma założona w Rumunii… i znalazła się na samym dole tabeli. Jedna z moich najlepiej radzących sobie firm miała siedzibę w Stanach Zjednoczonych, a jedna z najsłabszych – w Europie, więc twierdzenie, że „europejskie narzędzia lepiej radzą sobie z językiem niemieckim”, po prostu nie ma sensu. Nie chodzi więc o to, skąd pochodzi firma. Chodzi o to, czy narzędzie zostało stworzone z myślą o osobach nieposługujących się językiem angielskim. Bycie europejskim jest jedną z dróg do tego celu. Stworzenie narzędzia z myślą o globalnym przedsiębiorstwie, tak jak w przypadku Sembly, jest inną. Narzędzia, które zakładały znajomość języka angielskiego i traktowały wszystko inne jako dodatek, poniosły porażkę, niezależnie od tego, gdzie znajdowała się ich siedziba.
Narzędzie Siedziba główna Region
tl;dv Niemcy Europa
Zgromadzenie Nowy Jork, Stany Zjednoczone USA
HappyScribe Barcelona, Hiszpania Europa
Fathom San Francisco, Stany Zjednoczone USA
Jamie Niemcy Europa
Szpinak Nashville, Stany Zjednoczone USA
Fireflies San Francisco, Stany Zjednoczone USA
MeetGeek Bukareszt, Rumunia Europa
Otter Mountain View, Stany Zjednoczone USA
Grain San Francisco, Stany Zjednoczone USA
To nie German zepsuł te narzędzia. O wyniku zadecydowały decyzje podjęte na poziomie silnika.

Które niemieckie narzędzia do transkrypcji są zgodne z RODO?

Każde niemieckie narzędzie do transkrypcji, które przetestowałem, deklaruje zgodność z RODO, co właściwie nic nie znaczy. To coś w rodzaju „pucharu za udział” w dziedzinie ochrony danych. Dwa pytania, które faktycznie decydują o tym, czy dane narzędzie jest bezpieczne dla niemieckiego zespołu, są znacznie mniej oczywiste: gdzie przetwarzane są dane i czy narzędzie wykorzystuje nagrania spotkań do szkolenia swojej sztucznej inteligencji?
Większość narzędzi amerykańskich odpowiada na pierwsze pytanie słowem „Ameryka” i ma nadzieję, że nigdy nie zadacie drugiego.

NarzędzieGdzie przetwarzane są daneCzy trenuje się sztuczną inteligencję na Twoich danych?Certyfikaty
tl;dvUE (niemiecka firma, centra danych w UE)NieRODO; SOC 2 / ISO 27001
ZgromadzenieMożliwość rejestracji w UE (spółka amerykańska)Z wyłączeniem przedsiębiorstw; niższe poziomy mogą zrezygnowaćSOC 2 typu II, RODO (bez ISO 27001)
HappyScribeTylko UE (Barcelona, centrum danych w UE)Nie podano do wiadomości publicznejSOC 2 typu II, RODO; centrum danych zgodne z normą ISO 27001
FathomUSATak, dane pozbawione elementów umożliwiających identyfikację (z możliwością rezygnacji)SOC 2 typu II, RODO, HIPAA (bez ISO 27001)
JamieTylko UE (Frankfurt, Niemcy)NieISO 27001, RODO, DORA (brak publicznego certyfikatu SOC 2)
SzpinakNie zostało to oficjalnie potwierdzoneNie zostało to oficjalnie potwierdzoneNie udało się zweryfikować publicznie
FirefliesDomyślnie Stany Zjednoczone (prywatna pamięć masowa w UE w wersji Enterprise)Nie (brak okresu przechowywania danych u dostawców)SOC 2 typu II, RODO, HIPAA
MeetGeekUSA lub UE (możliwość wyboru miejsca zamieszkania)NieSOC 2 typu II, RODO
Otter.aiUSATak, pozbawione elementów umożliwiających identyfikacjęSOC 2 typu II, RODO
GrainUSA (AWS)Nie zostało to oficjalnie potwierdzoneSOC 2 typu II, RODO

Na dwa punkty warto zwrócić szczególną uwagę. Fathom Otter Fathom Otter Fathom wykorzystują dane klientów do uczenia się. Najpierw je anonimizują, a Fathom rezygnację z tego, jednak domyślnie spotkania użytkowników służą udoskonalaniu ich modeli. W przypadku rozmowy w języku niemieckim, zawierającej informacje, które konkurencja chętnie by przeczytała, jest to właśnie ten rodzaj sformułowania, które inspektor ochrony danych zaznaczyłby na czerwono.


tl;dv, Jamie, Fireflies i MeetGeek zajmują przeciwne stanowisko i nie wykorzystują treści użytkowników do uczenia się. Najdalej w tym zakresie tl;dv Jamie i tl;dv , które przetwarzają dane wyłącznie na terenie UE – Jamie we Frankfurcie, a tl;dv niemiecka firma korzystająca z infrastruktury unijnej. Fireflies dane na serwerach w USA, chyba że zapłacisz za prywatną przestrzeń dyskową w wersji Enterprise. Jeśli Twoje kryteria to „dane w UE, brak szkolenia AI, audytowane”, wybór sprowadza się do tl;dv, Jamie i HappyScribe.

Jest też kwestia zgody, której Niemcy nie traktują jako formalności. Nagrywanie wypowiedzi kogoś bez jego zgody może być przestępstwem zgodnie z niemieckim prawem, więc strategia „bot po prostu dołącza” nie wchodzi w grę. Większość z tych narzędzi ogłasza się lub wyświetla monit o zgodę. Niewiele z nich wbudowuje zbieranie zgody jako rzeczywistą funkcję, zamiast pozostawiać to jako coś, o czym zapomniałeś zrobić.

Jedno zastrzeżenie, powiedziane wprost: informacje o „zgodności z RODO” i „siedzibie w UE” zmieniają się w zależności od poziomu cenowego i są dyskretnie aktualizowane, więc potraktuj tę tabelę jako aktualny stan na dany moment i przed podjęciem decyzji sprawdź informacje w centrum zaufania danego dostawcy. Ja tak zrobiłem.

Wnioski dotyczące rynku niemieckiego: na jakie tendencje należy zwrócić uwagę

Jeśli sam przeprowadzasz tego typu test (osobiście bym tego nie robił, bo było to niezwykle stresujące!) lub po prostu przeglądasz swoje niemieckie transkrypcje z większym krytycyzmem, oto konkretne błędy, które odróżniały najlepsze wyniki od najgorszych. Każdy z nich pojawiał się w więcej niż jednym narzędziu, więc potraktuj je jako punkty wyjścia do weryfikacji.

Słowo złożone „tell”

Niemiecki łączy słowa, a „Kurzgesagt” to najczystszy pojedynczy przypadek w tym eksperymencie. Jest to połączenie wyrażenia „kurz gesagt” (krótko mówiąc) w jedno słowo, więc każde narzędzie, które zwróciło je jako dwa słowa, pokazało, gdzie kończą się jego znajomości niemieckiego. Trzy najlepsze narzędzia zachowały je w całości. Większość narzędzi podzieliła je przynajmniej raz. Ta sama wada pojawia się w codziennych złożeniach: jedno narzędzie zamieniło „Pro-Accounts” (konta profesjonalne) ze skryptu na „pro Account” (na konto), co nie jest błędem ortograficznym, ale całkowicie innym znaczeniem. Znajdź złożone słowo i sprawdź, czy przetrwało. To trzydziestosekundowa lektura niemieckiego narzędzia.

Umlauty i eszett

Kropki i litera ß to pierwsze oznaki tego, czy narzędzie przetwarza język niemiecki, czy tylko go naśladuje. Brak umlautów to nie tylko kwestia estetyczna; może to zmienić znaczenie słowa, a zamiany na ae/oe/ue lub ss wskazują, że silnik opiera się na układzie klawiatury angielskiej. Najlepsze narzędzia zachowały je w całym tekście. Te słabsze potraktowały je jako opcjonalne.

Błąd działania filtra wulgaryzmów

Jedno z narzędzi ocenzurowało słowo „Mist”, zamieniając je na „****”. Dla osoby posługującej się językiem niemieckim jest to łagodne określenie, bliższe znaczeniu „bzdury” niż czegokolwiek, co zwykle się wycenzurowuje. Filtr dostosowany do języka angielskiego, który reaguje na nieszkodliwe niemieckie słowo, wskazuje, że narzędzie to podlega regułom, których nigdy nie wyłączono. Zwróć uwagę na gwiazdki, których osoba posługująca się językiem niemieckim by się nie spodziewała.

Liczby wyrażone słownie i odwrócenie

Jedno z narzędzi zapisywało liczby słownie, np. „zweitausendfünfundzwanzig” zamiast 2025 – co było poprawne, ale strasznie utrudniało skanowanie. Gorszy był przypadek, w którym „72 procent” zamieniło się w „270 procent”, oraz ten, w którym „über 1200” zostało przekształcone w „eins 200”. Są to błędy merytoryczne, a nie wpadki transkrypcyjne, które przenoszą się do podsumowań, a następnie do decyzji. Sprawdzaj każdą liczbę ręcznie.

Główna przyczyna: silniki wyszukiwania z językiem angielskim jako domyślnym, skierowane na język niemiecki

Prawie każdy z powyższych schematów sprowadza się do jednego. Silnik, który domyślnie zakłada język angielski, nieustannie sięga po angielskie nawyki: filtr wulgaryzmów, domysły dotyczące zapożyczeń oraz fonetyczne rozwiązania awaryjne, gdy gubi wątek. Właśnie dlatego „AI-Slop” pojawiał się w różnych narzędziach jako „Slog”, „Slob” i „Slot”. Otaczający go niemiecki tekst był w porządku. Jednak leżący u podstaw instynkt angielski wciąż dawał o sobie znać.

Jak wybrać narzędzie do prowadzenia spotkań oparte na sztucznej inteligencji dla spotkań w języku niemieckim

Ten test ma największe znaczenie, jeśli prowadzisz spotkania w języku niemieckim i potrzebujesz wiarygodnego zapisu: dotyczy to zespołów niemieckojęzycznych, firm z UE pracujących w swoim własnym języku, wszystkich, którzy dostarczają transkrypcje lub streszczenia niemieckojęzycznym klientom, a także nabywców dbających o zgodność z RODO, którzy już teraz zwracają uwagę na to, gdzie trafiają ich dane. Najmniej znaczenia ma to dla jednej grupy – osób, które założyły, że każde narzędzie radzi sobie z językiem niemieckim, skoro radzi sobie z angielskim. To właśnie to założenie jest przyczyną słabych wyników w tabeli.

Dla wszystkich pozostałych wybór sprowadza się do tego, co jest dla was najważniejsze, ponieważ każdy z czterech zwycięzców zdobył maksymalną liczbę punktów w inny sposób.

Potrzebujesz obsługi w języku niemieckim od początku do końca? tl;dv równych. Było to jedyne narzędzie, które przez cały czas działało w języku niemieckim – zarówno w transkrypcji, streszczeniu, jak i na pulpicie nawigacyjnym – bez cichego przełączania się na angielski na etapie podsumowania. To właśnie z tego narzędzia czerpię dochody, a mimo to musiało zadowolić się remisem, a nie zwycięstwem, więc potraktujcie tę rekomendację z odpowiednim dystansem.

Potrzebujesz jak najdokładniejszego zapisu surowego? Sembly uzyskało w teście najwyższy wynik pod względem zgodności słowo w słowo.** Pamiętaj jednak, że e-mail z podsumowaniem może zostać wysłany w języku angielskim, nawet jeśli spotkanie nie odbywało się w tym języku.

Szukasz najdokładniejszych zapisów tekstowych? HappyScribe nie ma sobie równych. Aplikacja ta powstała z myślą przede wszystkim o transkrypcji i generuje najbardziej szczegółowe oraz najlepiej oznaczone streszczenia spośród wszystkich testowanych narzędzi – a właśnie tego potrzebujesz, gdy samym tekstem jest efekt końcowy.

Szukasz najbardziej autentycznej, naturalnej wersji języka niemieckiego? W takim razie , na podstawie naszych testów, najlepszym wyborem będzie „Spinach”; jedynym problemem jest to, że pozostaje on dostępny wyłącznie w transkrypcji. Być może wynika to z tego, że podczas rejestracji wybrałem „angielski”; nie sądzę jednak, żebym to zrobił, ponieważ podczas rejestracji celowo wybrałem niemiecki (Deutsch dla tych, którzy naprawdę się nad tym zastanawiali – widzimy was!), ale najwyraźniej interfejs bardzo chciał, żebym wszystko widział w języku angielskim. 

Trzy identyczne wyniki i jedna opinia native speakera: cztery różne zadania. Dopasuj narzędzie do swoich potrzeb.

Najlepsze narzędzia oparte na sztucznej inteligencji do prowadzenia spotkań w języku niemieckim: podsumowanie

W naszych testach na czoło wysunęły się cztery narzędzia, a najważniejsze jest to, że nie zajęły ex aequo tego samego miejsca. tl;dv początku do końca, HappyScribe zapewnia najdokładniejsze zapisy, a Spinach zdobył uznanie naszego niemieckojęzycznego eksperta. Nie ma jednego najlepszego narzędzia opartego na sztucznej inteligencji do prowadzenia spotkań w języku niemieckim. Istnieje narzędzie odpowiednie do konkretnego zadania, a także kilka pozycji w dolnej części tabeli, których należy unikać.

Piszę dla tl;dv, płacą mi za to i liczyłem, że wygrają bezapelacyjnie. Tak się jednak nie stało. Nawet najbardziej surowy sędzia w całym teście – native speaker języka niemieckiego, który nie dostrzegł ani jednego logo – nie przyznał im pierwszego miejsca. Test, który nie może wprawić klienta w zakłopotanie, nie jest testem, lecz reklamą. Ten zachował swoją ostrość i tylko dzięki temu wynik ma dla was jakąkolwiek wartość.

Jeśli potrzebujesz rozwiązania, w którym niemiecki jest wszechobecny, to właśnie oferuje tl;dv, a bezpłatny plan pozwala przetestować je podczas prawdziwego spotkania, zanim zdecydujesz się na pełną wersję. Wypróbuj tę usługę podczas następnej rozmowy w języku niemieckim i sprawdź, czy podsumowanie zostanie wygenerowane w odpowiednim języku. Dziewięć minut prawdziwego nagrania powie Ci więcej niż jakakolwiek strona z opisem funkcji.

Często zadawane pytania: Narzędzia do spotkań oparte na sztucznej inteligencji do transkrypcji w języku niemieckim

Najlepszymi narzędziami opartymi na sztucznej inteligencji do prowadzenia spotkań w języku niemieckim są tl;dv, Sembly i HappyScribe, które w kontrolowanym teście dziesięciu narzędzi przeprowadzonym na tym samym niemieckim nagraniu wideo uzyskały ex aequo wynik 48 na 50 punktów.

tl;dv jedynym narzędziem, które od początku do końca pozwalało zachować transkrypcję i streszczenie w języku niemieckim.

Z naszych badań wynika, że nie wszystkie z nich działały spójnie. W tym teście dziesięć narzędzi, które w swoich reklamach deklarowały obsługę języka niemieckiego, uzyskało różnice w wynikach sięgające 42 punktów przy ocenie tego samego dziewięciominutowego filmu w języku niemieckim (w skali 50-punktowej). Niektóre z nich przetłumaczyły niemiecki niemal bezbłędnie. Inne generowały fonetyczny bełkot w języku angielskim lub całkowicie zmieniały język. Obsługa języka niemieckiego a dokładność tłumaczenia na ten język to nie to samo, a reputacja narzędzia w języku angielskim niewiele mówi o tym, jak radzi sobie z językiem niemieckim.

Najsłabsze Otter w testach Otter Grain Otter . Grain 6 Grain na 50 możliwych, generując bezsensowne frazy w języku angielskim zamiast niemieckiego, a podczas jednego przebiegu poinformował, że nie ma treści do streszczenia. Otter 30 punktów i podczas jednego przebiegu całkowicie zrezygnował z języka niemieckiego, generując łamaną angielszczyznę bez żadnych komunikatów o błędach ani ostrzeżeń. Oba programy wymieniają niemiecki jako obsługiwany język.

Najlepsze narzędzia potrafią to zrobić, ale wiele z nich nie radzi sobie z tym niezawodnie. W języku niemieckim słowa łączą się w długie złożenia, a nazwa marki „Kurzgesagt” stała się dobrym sprawdzianem: słabsze narzędzia rozdzielają ją na „kurz gesagt”, ujawniając tym samym, że ich model języka niemieckiego jest powierzchowny. Umlauty (ä, ö, ü) i eszett (ß) są drugą wskazówką, ponieważ narzędzia, które zastępują je literami ae, oe, ue lub ss, raczej przybliżają niemiecki niż go przetwarzają.

Narzędzia przełączały się na język angielski, ponieważ ich silnik rozpoznawania mowy domyślnie korzysta z języka angielskiego i traktuje inne języki jako dodatkowe ustawienia. Gdy silnik tracił pewność co do niemieckiego nagrania, powracał do angielskich wzorców, dokonując transkrypcji fonetycznej, stosując angielskie filtry przekleństw lub generując streszczenie w języku angielskim, nawet jeśli transkrypcja była w języku niemieckim. To właśnie ta koncepcja „angielski przede wszystkim”, a nie trudność samego języka niemieckiego, wyjaśnia większość niepowodzeń podczas testów.

Tak. W tym teście tl;dv pierwsze miejsce, uzyskując 48 na 50 punktów, i był jedynym z dziesięciu narzędzi, które od początku do końca wyświetlały transkrypcję, streszczenie i pulpit nawigacyjny w języku niemieckim, bez przełączania się na angielski na etapie podsumowania.

Osoba, dla której niemiecki jest językiem ojczystym, oceniająca transkrypcje w trybie ślepym – bez widocznych nazw narzędzi – umieściła je w najwyższym przedziale, obok HappyScribe i Spinach.

Niekoniecznie.

Kiedy tl;dv przetestowana na koncie darmowym, a nie płatnym, transkrypcja okazała się krótsza, ale nadal poprawna pod względem językowym w języku niemieckim, więc jakość podstawowej transkrypcji nie uległa pogorszeniu bez subskrypcji. Kilka innych narzędzi w tym teście również przetestowano w ramach bezpłatnych wersji próbnych oferujących tę samą funkcjonalność. Poziom planu taryfowego miał większy wpływ na długość i funkcje niż na samą poprawność językową w języku niemieckim, choć dostępność często ulega zmianom, dlatego przed skorzystaniem z niego warto sprawdzić aktualny plan darmowy.

Tak. Większość narzędzi, które przetestowałem, umożliwia nagrywanie i transkrypcję języka niemieckiego w ramach bezpłatnego planu, ale haczyk tkwi w limitach. Bezpłatny plan tl;dvpozwala na nagrywanie i transkrypcję języka niemieckiego. Fathom najhojniejsze warunki w zakresie samego nagrywania – usługa jest bezpłatna i nie ma limitów, choć dane są domyślnie przechowywane w USA i służą do szkolenia modeli. Darmowe plany Fireflies 800 minut przechowywania), MeetGeek (trzy godziny miesięcznie) i Otter się szybciej, niż byś chciał. Dla niemieckiego zespołu, który chce mieć darmowe rozwiązanie w UE, bez uczenia AI w jednym miejscu, tl;dv jedyny darmowy plan, który spełnia wszystkie trzy warunki.

Sygnatury czasowe były spójne we wszystkich narzędziach, które generowały użyteczne wyniki w języku niemieckim, więc ta część jest wiarygodna. Trzy narzędzia, które poprawnie obsłużyły język niemiecki – tl;dv, Sembly i HappyScribe – zwróciły transkrypcje w języku niemieckim z prawidłowymi sygnaturami czasowymi i bez zaburzeń formatowania. Jeśli dokładne rozróżnienie mówców w języku niemieckim jest niezbędnym wymogiem, należy najpierw przetestować to na własnej rozmowie z wieloma uczestnikami.

Nie tak niezawodnie, jak w przypadku standardowego niemieckiego, a właśnie w przypadku szwajcarskiego niemieckiego większość narzędzi zaczyna zgadywać. W moim teście wykorzystałem narrację w standardowym niemieckim wysokim, więc nie oceniałem bezpośrednio dialektów. Opublikowane wyniki testów porównawczych wskazują, że dokładność w przypadku niemieckiego austriackiego wynosi około 91–93 procent, a szwajcarskiego niemieckiego spada do 80–87 procent, co mniej więcej odpowiada momentowi, w którym przestaje się ufać transkrypcji. HappyScribe jest jedynym narzędziem spośród dziesięciu, które reklamuje dedykowaną obsługę szwajcarskiego niemieckiego jako konkretną funkcję, choć jest to ich twierdzenie, a nie wynik mojego testu. 

To zależy od tego, co zamierzasz kupić. W moim teście tl;dv, Sembly i HappyScribe osiągnęły ex aequo najwyższą dokładność, więc jeśli chodzi o samą jakość tłumaczenia na język niemiecki, nie zapłacisz za różnicę między nimi. Wybór zależy od priorytetów: wybierz tl;dv zależy Ci na wysokiej jakości tłumaczeniach na niemiecki, przydatnym planie darmowym, przetwarzaniu danych w UE oraz braku szkolenia modeli AI. Wybierz Fathom darmowa usługa i nieograniczona długość nagrań są dla Ciebie ważniejsze niż lokalizacja przechowywania danych. Wybierz HappyScribe, jeśli potrzebujesz najszerszego zakresu języków i dialektów. Nie ma tu jednego zwycięzcy pod względem najlepszego stosunku jakości do ceny, a jedynie rozwiązanie najlepiej dopasowane do tego, co jest dla Ciebie najważniejsze.