Recenzja Temi

Według strony internetowej z Temi korzysta ponad 10 000 klientów, w tym ESPN i San Diego Union-Tribune.

Firma stojąca za Temi jest powiązana z inną operacją transkrypcji Rev, która wykorzystuje ludzi do przetwarzania dźwięku, ale to rozwiązanie wykorzystuje uczenie maszynowe do szybkiego i taniego przetwarzania plików.

Wszyscy chcemy, aby dźwięk był transkrybowany dokładnie i tanio, ale czy to właśnie oferuje Temi?

Chcesz wypróbować Temi? Sprawdź witrynę tutaj

Plany i ceny

Model cenowy dla Temi jest niezwykle prosty, bo 0,25 USD za minutę nagrania audio. Dlatego możesz chcieć uniknąć wysyłania pliku, w którym pierwsze dziesięć minut składa się z ludzi wchodzących do pokoju i nikt nie mówi nic znaczącego.

Ceny są proste, ale nie uwzględniają zbytnio tych użytkowników, którzy mogą przenosić duże ilości treści za pośrednictwem rozwiązania.

Powinniśmy wspomnieć, że Temi jest teraz droższe niż kiedyś, ponieważ zaledwie kilka lat temu pobierało tylko 0,10 USD za minutę. W porównaniu z transkrypcją ręczną jest nadal tania, ale inne mogą oferować tańsze usługi oparte na sztucznej inteligencji.

Projekt

Temi ma tak prosty interfejs, jak to tylko możliwe do skonstruowania w tym celu. Witryna kieruje użytkownika do przesłania pliku, a następnie zadaje kilka prostych pytań dotyczących jakości dźwięku, zanim przejdzie do przetwarzania dźwięku na tekst.

Po zakończeniu przetwarzania otrzymasz e-maila z informacją, która umożliwi Ci edycję i przeglądanie transkrypcji za pomocą interfejsu internetowego Temi.

Szybkość transkrypcji jest mniej więcej o połowę krótsza od czasu nagrywania, więc 2-minutowy klip audio trwa około minuty.

I to wszystko, co ma do zaoferowania Temi, ponieważ nie zawiera możliwości ostrzeżenia przetwarzającej sztucznej inteligencji, jaki dialekt ma przetwarzać, a jedynym językiem, z jakim może się posługiwać, jest angielski.

Obsługiwane formaty audio to mp3, mp4, m4a, aac i wav. Pliki wideo, z których może wyodrębnić dźwięk, obejmują mp4, wma, mov i avi. Chociaż warto stwierdzić, że te pliki wideo nie są formatami, ale pakietami technicznymi, a zatem mogą zawierać struktury audio i wideo, których Temi może nie rozumieć.

Z tego, co rozumiemy, Temi nie radzi sobie z filmami zawierającymi wiele ścieżek dźwiękowych.

Nagrania

Po przetworzeniu pliku można uzyskać do niego dostęp za pośrednictwem edytora internetowego, w którym można od razu zobaczyć, jak zinterpretował go Temi.

Po wejściu do edytora możesz poruszać się po dźwięku i tekście transkrypcji, gdy są zsynchronizowane, a także w razie potrzeby edytować, wyróżniać i uderzać słowa.

Możesz również zidentyfikować mówcę, aby podczas eksportowania transkrypcji poprawnie nazwał zaangażowanych.

Poza tym edytor zawiera niewiele funkcji, które można by szczegółowo opisać. Powyżej znajduje się strona Pulpitu nawigacyjnego, która zawiera listę przetworzonych plików. Pulpit nawigacyjny nie może tworzyć folderów ani etykiet do grupowania przekonwertowanych plików i został zaprojektowany do obsługi tylko kilkudziesięciu dokumentów jednocześnie.

Pliki można eksportować w formacie Word docx, PDF lub jako zwykły tekst albo jako podpisy w formacie SRT lub VTT.

Alternatywnie możesz udostępnić plik za pośrednictwem łącza, które możesz umieścić w wiadomości e-mail lub rozpowszechniać za pomocą mediów społecznościowych.

Brakuje konta grupowego, na którym wielu użytkowników może pracować nad wieloma transkrypcjami lub koordynować swoje wysiłki.

Precyzja

W najlepszym przypadku Temi jest rozczarowującym systemem transkrypcji, który nie ogranicza się tylko do języka angielskiego, ale także wydaje się być mocno nastawiony wyłącznie na amerykański angielski. Nasze próby przetworzenia wysokiej jakości dźwięku pochodzącego z języka angielskiego wygenerowały znaczną liczbę nieścisłości i regionalnych błędów ortograficznych.

System wydawał się również nieświadomy faktu, że tytuły pisane są wielkimi literami w języku angielskim, podobnie jak nazwy własne, co skutkuje „mr” i „mrs”. Model gramatyczny nie był również w stanie określić, kiedy należy użyć wyrażenia „były” lub „gdzie”, ani innych słów, które brzmią tak samo, ale wymagają kontekstu do poprawnej pisowni.

Szybkość przetwarzania dźwięku przez Temi jest osłabiana przez ilość pracy potrzebnej do naprawienia widocznych błędów w generowanych transkrypcjach. Te błędy są problematyczne dla narzędzia do transkrypcji, chyba że dokładność konwersji nie jest dla Ciebie interesująca.

Firma stojąca za tym produktem rozumie jego ograniczenia, a link na stronie internetowej kieruje klientów do stowarzyszonej witryny Rev, która potrzebuje 99% dokładności.

Jedną z frustracji jest to, że nie możesz aktywnie pomóc Temi w lepszej pracy, naprawiając wielokrotnie błędnie interpretowane słowa lub tworząc bibliotekę nazw, terminów technicznych lub skrótów.

Z tego powodu może się okazać, że za każdym razem, gdy edytujesz plik przetworzony za pomocą Temi, powtarzasz te same poprawki, co wcześniej, co może szybko stać się irytujące.

Jeśli szukasz transkrypcji, w której duży procent tekstu jest zgodny z tym, co zostało powiedziane, prawdopodobnie Temi nie jest narzędziem, którego potrzebujesz.

Wszystko w Temi jest proste, łącznie z edytorem

Mobile Temi

Kontynuując motyw podstawowych interfejsów, mobilna wersja Temi jest dostępna zarówno dla urządzeń Apple iOS, jak i Google Android. Po zainstalowaniu aplikacja mobilna umożliwia telefonowi lub tabletowi nagrywanie dźwięku, a następnie wysyłanie go bezpośrednio do przetwarzania Temi.

Oprogramowanie umożliwia również obsługę płatności mobilnych, więc za transkrypcję można zapłacić za pośrednictwem urządzenia.

Funkcje aplikacji mogą być naprawdę przydatne dla kogoś, kto musi nagrać rozmowę, a wkrótce potem mieć transkrypcję. Należy jednak wspomnieć, że zarówno Apple, jak i Google oferują tę funkcjonalność z natury na swoich platformach, przy zerowych kosztach, dla tych, którzy chcą z niej korzystać.

Ostateczny werdykt

Temi to stosunkowo niedrogie rozwiązanie, ale w tym przypadku dostajesz to, za co płacisz.

Osoby stojące za tą usługą obiecują, że wkrótce dodadzą nowe języki, aby zwiększyć atrakcyjność Temi. Jednak te ambicje ignorują fakt, że angielska transkrypcja musi być dokładniejsza i lepiej radzić sobie z różnicami regionalnymi.

Obecny model działa niezawodnie tylko z głośnikami amerykańskimi, a nawet z tym ograniczeniem dokładność nie jest wyjątkowa. W porównaniu do Happy Scribe, Temi nie dostarcza skutecznie dokładnych transkrypcji, niezależnie od jakości nagrań.

Twórcy Temi starali się stworzyć system, który jest bardzo prosty i nie zmyli użytkowników, zadając zbyt wiele pytań. Jednak jego prostota nie pozwala użytkownikowi na lepsze wykonanie pracy lub stworzenie bardziej przewidywalnego mechanizmu transkrypcji.

Dla osób z umiejętnościami technicznymi Temi ma interfejs API, który umożliwia programistom dostęp do kierunku silnika transkrypcji, a integracja Zapier może łączyć dane biznesowe Gmaila, Dropbox i Dysk Google jako źródła plików audio.

Jeśli więc dokładność Temi jest wystarczająco dobra dla twoich celów, a cena jest akceptowalna, wówczas tę technologię można wykorzystać jako część procesu przepływu pracy.

Choć brzmi to pożytecznie, nie jesteśmy przekonani, że jest to wystarczająco elastyczne rozwiązanie dla wszystkich mówiących po angielsku, gwarantujące inwestycję czasu i pieniędzy w zintegrowanie go z istniejącymi systemami.