Recenzja wokaliczna

Vocalmatic to internetowa usługa transkrypcji stworzona przez kanadyjską firmę Enactics Inc.

Według jej strony, istnieje po to, aby „pomóc ludziom pracującym z nagraniami audio zaoszczędzić czas na transkrypcji ich audio i wideo na tekst”.

Biorąc pod uwagę liczbę różnych dostępnych narzędzi transkrypcji online, co sprawia, że ​​jest ono wyjątkowe?

  • Chcesz wypróbować Vocalmatic? Sprawdź witrynę tutaj

Plany i ceny

Kiedy zarejestrujesz się w Vocalmatic, otrzymasz natychmiast 30 minut czasu na transkrypcję, a kiedy to się skończy, możesz kupić dodatkowe godziny, zaczynając od 15 USD za jedną godzinę.

Im więcej godzin kupujesz, tym mniej kosztują, przy czym 90-100 godzin kosztuje średnio zaledwie 6 USD za godzinę.

Ceny te dotyczą indywidualnych użytkowników, a Enactics oferuje elastyczne ceny dla firm, w których wielu użytkowników wymaga dostępu, a wolumeny będą prawdopodobnie wysokie.

Jeśli masz zapotrzebowanie na sprzedaż hurtową, najlepszym sposobem na obniżenie kosztów jest skorzystanie z karnetu dziennego. Umożliwiają one nieograniczone korzystanie z usługi przez jeden dzień z limitem trzech plików na godzinę.

Korzystanie z tych karnetów kosztuje 15 USD, trzy dni 17 USD, a siedem dni to 25 USD, a jeśli możesz zorganizować całą swoją pracę w bloki, jest to najtańszy sposób korzystania z Vocalmatic.

Projekt

Nawet według standardów transkrypcji online Vocalmatic jest podstawowy. Ale odwrotnie, sprawia, że ​​jest niezwykle łatwy w użyciu nawet dla osób z ograniczonymi umiejętnościami komputerowymi.

Prosty, czteroetapowy proces rozpoczyna się od określenia, czy masz audio, wideo, czy wyłącznie dla klientów amerykańskich, do których chcesz zadzwonić i poddać bezpośrednio transkrypcję swoich słów.

Większość użytkowników będzie używać plików audio lub wideo, które w kroku 2 są przesyłane do witryny Vocalmatic. Obecnie obsługiwane typy obejmują; Pliki audio mp3, m4a, mp4, flac, ogg, wav, aac, opus, oga, mogg, webm i wma.

Trzecim krokiem jest zdefiniowanie narodowości mówiącej, a czwartym określeniem, jak chcesz uzyskać wynik.

Języki są z pewnością mocną stroną tego systemu, ponieważ obecnie transkrybuje angielski, hiszpański, francuski, niemiecki, portugalski, włoski, holenderski, polski, czeski, rumuński, chiński (mandaryński), chiński (kantoński), japoński, filipiński, wietnamski, arabski , Perski, hindi, tajski, koreański, urdu, turecki, hebrajski, grecki, bułgarski, rosyjski, fiński, szwedzki, duński, afrikaans, amharski, ormiański, azerbejdżański, indonezyjski, malajski, bengalski, kataloński, baskijski, galicyjski, gruziński, gudżaracki , Chorwacki, zuluski, islandzki, jawajski, kannada, khmerski, laotański, łotewski, litewski, węgierski, malajalam, marathi, norweski, serbski, ukraiński, syngaleski, słowacki, słoweński, sundajski, suahili, tamilski i telugu.

Choć ta lista jest imponująca, nie wszystkie akcenty i dialekty w każdym języku są rozpoznawane.

Domyślna opcja wyjściowa wykorzystuje proste formatowanie, a wybór SRT jest przeznaczony dla osób tworzących napisy do wideo.

Po dokonaniu tych wyborów i dostarczeniu pliku, jeśli na koncie zostało wystarczająco dużo czasu, system rozpocznie przetwarzanie pliku na tekst.

Wysyłana jest wiadomość e-mail z informacją, że system rozpoczął proces, a kolejna jest wysyłana po jego zakończeniu.

To, jak długo to potrwa, zależy całkowicie od tego, jak zajęte są serwery Vocalmatic, ale ogólnie okazało się, że było to blisko czasu nagrywania, a może trochę dłużej.

Przetwarzanie jednego 19-minutowego nagrania trwało około 28 minut, ale inne krótsze części były proporcjonalnie szybsze.

Po przetworzeniu pliku możesz przejść do edytora i zobaczyć, jak to się stało, i wprowadzić pewne zmiany w formatowaniu i zawartości.

Ten system nie zapewnia formatowania gramatycznego. Nie wstawia powrotów karetki między zdaniami, niezależnie od przerwy w mówieniu, i nie zawsze zapisuje nazwy wielkimi literami.

I umieszcza kod czasowy między fragmentami transkrypcji, nawet jeśli nie używasz go do generowania pliku SRT.

Dźwięk można odtworzyć w edytorze treści, ale nie próbuje on pokazać, gdzie w transkrypcji znajduje się dźwięk.

Gdy jesteś „zadowolony” z wyników, tekst można wyeksportować jako dokument programu Word lub plik tekstowy w trybie domyślnym oraz pliki SRT, jeśli wybierzesz ten tryb wyjściowy.

Precyzja

W artykule Vocalmatic FAQ stwierdza się: „Spodziewamy się dokładności 80-90% na czystym dźwięku. Jeśli w tle jest dużo hałasu lub jeśli ludzie rozmawiają w tym samym czasie, transkrypcja może mieć mniej niż 10% dokładności ”.

Cóż, w ograniczonych testach, nawet urywkach audiobooków, z możliwie najczystszym dźwiękiem, nie udało nam się osiągnąć tego poziomu dokładności.

Nawet przy najlepszych próbach często powtarza część akapitu lub słów, otrzymuje błędną nazwę, że poprawiła poprzednie zdanie, i zaśmieca transkrypcję błędami.

Kiedy nagrania nie są nieskazitelne, takie jak testy naszych przemówień historycznych, wyniki mogą być niezrozumiałe.

Najbardziej niepokojące było to, że gdy wystąpił problem ze słowem lub frazą, Vocalmatic losowo wypluwał pojedyncze litery. W języku angielskim, w którym testowaliśmy, litera „y” sama w sobie nie jest słowem, podobnie jak „m”, „k ani„ t ”.

To, że wynik nie jest zgodny z żadnym słownikiem lub określonymi formami gramatycznymi, nie wydaje się stanowić problemu dla oprogramowania. Brakuje również zrozumienia kontekstu, ponieważ wielokrotnie interpretował syna jako „Słońce”.

Kiedy weźmiesz pod uwagę wszystkie poprawki i dodasz kropki, przecinki i poprawne wielkie litery, nawet lepsze próby wymagają znacznych korekt, aby zostały uznane za dokładne.

Ostateczny werdykt

Ta usługa nie jest tania, tak szybka ani bardzo dokładna.

Radość z 30 minut wolnego czasu wyczerpuje się niepokojąco szybko, nawet jeśli rozwiązanie jest łatwo dostępne i bardzo łatwe w użyciu.

Jedną z zalet wolnego czasu potencjalnego klienta jest to, że pozwala on przesłać przykład nagrań, które prawdopodobnie będziesz potrzebować transkrypcji, i zobaczyć, jak one działają.

Tylko jeśli zwróci tekst, który ogólnie reprezentuje to, co zostało powiedziane w dźwięku, kontynuujemy, ale wypróbujmy inne opcje przed zapłaceniem za tę.

W porównaniu z niektórymi innymi opcjami, w szczególności Transkrypcją autorstwa Wreally, Trint i Happy Scribe, nie jest to wystarczająco dokładne, aby było warte swojej ceny.

Może jesteśmy nieuprzejmi i wspaniale spisuje się w suahili lub innych językach, ale bazując wyłącznie na jego wysiłkach z angielskim, wybraliśmy coś innego.

Interesujące artykuły...