Recenzja Capti Voice

Spisie treści:

Anonim

Początki Capti Voice nie są typowym genialnym koderem spotyka się z historią bankierów inwestycyjnych, ponieważ biznes, który za nim stoi, został założony przez profesorów informatyki i doktorantów.

Dziesięć lat po założeniu przez pięć osób Charmtech Labs LLC działa poza Uniwersytetem w Buffalo’s Educational Opportunity Center w stanie Nowy Jork i zatrudnia znacznie większą liczbę pracowników naukowych.

Rozwiązania, na podstawie których opracowano Charmtech Labs, były projektem badawczym mającym na celu zapewnienie czytania z ekranu dla osób niewidomych. Od tego czasu praca ta rozszerzyła się na powszechnie dostępne narzędzia, które mogą spersonalizować czytanie, uczynić czytanie bardziej interaktywnym i zwiększyć produktywność.

Spójrzmy na Capti Voice i zobaczmy, czy jego uniwersyteckie pochodzenie przyniosło komercyjnego zwycięzcę lub ćwiczenie w środowisku akademickim?

  • Chcesz wypróbować Voice Reader Home 15? Sprawdź witrynę tutaj

Plany i ceny

Do użytku osobistego Capti Voice jest bezpłatny. Rejestrujesz się i możesz otworzyć dokument lub zaznaczyć sekcję strony internetowej, a technologia odczyta Ci go.

Ale jeśli chcesz uzyskać lepszą jakość głosów, więcej typów dokumentów, edycję dokumentów i tłumaczenia językowe, musisz wykupić abonament Premium i głos Premium.

Plan Premium kosztuje 1,99 USD miesięcznie, 9,99 USD za sześć miesięcy lub 19,99 USD rocznie. Każdy głos premium kosztuje 5,99 USD miesięcznie, 9,99 USD za trzy miesiące i 29,99 USD rocznie.

Dzięki abonamentowi Premium i Premium Voice całkowity koszt 49,98 USD każdego roku wydaje się bardzo rozsądny, a jeśli znudzi Ci się głos, możesz go zmienić na inny pod koniec okresu subskrypcji.

Projekt

Interfejs internetowy Capti Voice nie odbiega znacząco od tego, co widzieliśmy u innych dostawców przetwarzania tekstu na mowę (TTV).

Dokumenty są pogrupowane jako ścieżki na listach odtwarzania, a kliknięcie ich na lewym pasku bocznym otwiera je w panelu dokumentów, z którego można je odczytywać.

Utwory można przesyłać bezpośrednio z komputera lub łącza lub pozyskiwać z Blackboard, Canvas, Dropbox, Google Drive, Instapaper, OneDrive, Bookshare lub Gutenberg,

Niektóre z tych opcji wskazują na edukacyjny ton tego rozwiązania i istnieje wiele aspektów tego rozwiązania, które nadają się do osobistych celów edukacyjnych i dydaktycznych.

Na przykład dla każdego fragmentu tekstu można wyróżnić akapity i utworzyć uwagi dodatkowe. Dla tych, którzy pracują nad sztukami Williama Szekspira lub podobnymi dokumentami, wypowiadanie słów i tworzenie notatek na temat intencji postaci lub kontekstu historycznego, na przykład, byłoby doskonałym zastosowaniem tego narzędzia.

Wersja bezpłatna nie pozwala na edycję dokumentu, ale licencja Premium pozwala na użycie Capti jako rozwiązania do korygowania błędów. W przypadku większości ludzi często łatwiej jest usłyszeć błędy niż je zobaczyć.

Licencjonowanie jest przyznawane za głos

Osobliwością Capti jest to, że domyślny angielski głos, Salli, jest wyjątkowo zły.

Nie jestem pewien, czy było to celowe szturchnięcie, aby zachęcić do korzystania z Premium Voices, ale domyślnie jest to amerykańska kobieta, która brzmi jak irytujące dziecko.

Oprócz młodej Salli użytkownicy systemu Windows 10 zobaczą również wszystkie głosy pulpitu, które są automatycznie instalowane przez Cortanę. Microsoft nie może zaakceptować faktu, że wszyscy na świecie nie są Amerykanami, więc każdy powinien mieć amerykańską Zirę, a na naszych komputerach mamy również brytyjską Hazel.

Capti Voice zakłada również, że każdy mówiący po angielsku jest Amerykaninem, przez co Salli jest naszym domyślnym. Kiedy zmieniliśmy obywatelstwo na Wielką Brytanię, stała się Premium Voice, a naszym domyślnym była Hazel dostarczona przez Microsoft.

Ta zmiana nas nie zawiodła, ponieważ słuchanie Salli było jak uwięzienie w szczególnie irytującym odcinku Saved By the Bell.

Capti to wyrafinowane narzędzie, ale brakuje mu jednej funkcji, której wielu mogłoby się spodziewać. Nie ma standardowego mechanizmu eksportowania mówionego dźwięku do formatu MP3 lub innego formatu audio.

Istnieją sposoby na obejście tego za pomocą sterownika audio, który przekierowuje wyjście na wejście, umożliwiając przechwytywanie go dowolnej aplikacji do nagrywania dźwięku, ale ta funkcja w Capti byłaby bardziej elegancka.

Capti oferuje tygodniowy okres próbny Premium dla użytkowników z poziomu bezpłatnego

Precyzja

W porównaniu z niektórymi rozwiązaniami TTV, o których możemy wspomnieć, Capti Voice jest niezwykle precyzyjny.

Ponieważ testowaliśmy oprogramowanie mówiące, opracowaliśmy kilka dokumentów, które zawierają frazy i słowa, które potykają się z tymi rozwiązaniami i testują różnice w wymowie między regionami, a Capti Voice przeskakuje przez te słowne pola minowe w najbardziej imponujący sposób.

Udaje mu się zrozumieć kontekst, jak w zdaniu „Żołnierz polski zdecydował się wypolerować buty”, gdzie jedna pisownia jest używana dwukrotnie, ale za każdym razem wymawiana jest inaczej. Capti Voice odniósł sukces w tym teście, a niektóre inne słowa o identycznej pisowni wymagają subtelnej obsługi. To, jak dobre jest w tym oprogramowanie, jest ważne, ponieważ nie zawiera mechanizmu dostosowywania wymowy, jeśli nie jest ona właściwa.

Przewidujemy, że to ograniczenie może być problemem przy wypowiadaniu niektórych nazwisk.

Ogólnie rzecz biorąc, Capti Voice wykonuje najwyższej klasy pracę polegającą na mówieniu tekstu i popełnia mniej błędów, niż byśmy zwykle widzieli.

Capti może być oparty na przeglądarce lub dostępna jest wersja mobilna na Androida i iOS

Ostateczny werdykt

Nieczęsto mówimy to o produkcie, ale Capti Voice jest jednym z najlepszych rozwiązań do przetwarzania tekstu na głos, jakie widzieliśmy dla tych, którzy chcą odczytać im dokumenty.

Oprogramowanie przepuszcza złożone zdania z niezwykłą łatwością i dostarcza je jasno i zwięźle. A dzięki subskrypcji Premium Plan może tłumaczyć na inne języki, a nawet czytać tekst z obrazów.

Biorąc pod uwagę stosunkowo niską cenę, liczbę obsługiwanych głosów i języków, sprawia to, że jego konkurenci wydają się zdecydowanie zawyżeni i nieskomplikowani.

Jest to idealne rozwiązanie dla każdego z wadami wzroku, trudnościami w nauce lub dla tych, którzy wolą słuchać dokumentów niż je czytać.

Jeśli ma jakąś słabość, to dlatego, że programiści nigdy nie brali pod uwagę, że niektórzy ludzie używają tego typu narzędzi do generowania plików audio MP3 do odtwarzania filmów lub odtwarzania z prostych cyfrowych urządzeń audio.

Nie trzeba sięgać głęboko pod powierzchnię, aby zobaczyć akademickie pochodzenie tego rozwiązania, ale dla osób pracujących w edukacji jest wiele do polubienia w jego podejściu.

Tylko nie zakładaj, że Salli jest najlepszym głosem, jaki może zrobić Capti, ponieważ ma do zaoferowania znacznie lepsze głosy niż ten.