Wiele narzędzi do rozpoznawania głosu wykorzystuje metody sztucznej inteligencji w celu zwiększenia ich dokładności, a Braina Pro właśnie to robi.
Jednak w pewnym sensie jest to wyjątkowe, ponieważ zamiast skupiać się na scenariuszu jednorazowego użytku, Braina jest narzędziem ogólnego przeznaczenia, które można zastosować do wielu celów i sytuacji.
Zamiast używać modelu sztucznej inteligencji, który ma sztywne pojęcie o tym, jak ludzie mówią, ma algorytm uczenia się, który analizuje każdą sesję, aby lepiej zrozumieć, jak mówisz.
Te różnice odróżniają Brainę od zwykłych narzędzi do dyktowania i osobistych asystentów, ale czy to wystarczy, aby inwestycja czasu i pieniędzy przy użyciu tego produktu była opłacalna?
- Chcesz wypróbować Brainę? Sprawdź witrynę tutaj
Koszty
Tam, gdzie inne oprogramowanie tego typu oczekuje miesięcznej subskrypcji, Braina ma tylko jednorazowe opcje płatności, a jedną z trzech możliwości jest bezpłatna wersja „Lite”.
Produkt komercyjny Braina Pro można subskrybować na rok lub na czas nieokreślony z dożywotnią licencją. Rok kosztuje 49 USD, a dożywotnia licencja to 139 USD dla jednego użytkownika.
To, czego brakuje wersji Lite, to możliwość dyktowania, jest to wyłącznie język angielski i nie ma między innymi funkcji uczenia się wersji Pro.
Wszystkie wersje dla komputerów stacjonarnych są przeznaczone wyłącznie na platformę Windows, a wydanie Androida jest bezpłatne dla wszystkich. Chociaż jego najlepszym zastosowaniem jest kontrolowanie wersji Brainy działającej w innym miejscu na komputerze.
Projekt
Narzędziu Braina dla Windows brakuje pizzazzu lub nowoczesnej stylistyki aplikacji i nie wyglądałoby to nie na miejscu, działając w systemie Windows 7 lub nawet we wczesnych wersjach tego systemu operacyjnego Microsoft.
Jest to prosty panel z oknami, z serią menu rozwijanych u góry, linią wprowadzania danych u dołu i kilkoma ikonami, które kontrolują sposób, w jaki aplikacja mówi i słucha.
Ma trzy główne funkcje, które wykonuje i może wykonywać większość z nich niezależnie od tego, jakie inne aplikacje są aktualnie uruchomione lub na których skupia się system.
Jedną z nich jest wirtualna pomoc, która jest bardzo podobna do Siri, Alexa, Google Assistant i Cortana, jeśli używałeś któregokolwiek z nich.
Za jego pomocą możesz rozmawiać z komputerem, odpowiadać na pytania, uruchamiać aplikacje i tym podobne. Jest to tryb „głosowy” i może robić wszystko, co Cortana w systemie Windows 10. Można go w znacznym stopniu dostosować, aby odpowiadał na inną nazwę, a nawet odpowiadał w niestandardowy sposób.
Drugi tryb to możliwość odczytania dowolnego zaznaczonego tekstu i skopiowania go do schowka z dowolnej strony internetowej lub aplikacji.
Czytanie Brainy brzmi bardziej jak roboty w porównaniu z Alexą czy Asystentem Google, a wymowa niektórych słów jest po prostu błędna. Ale Braina Pro nie jest tutaj całkowicie winna, ponieważ ten głos jest generowany przez Microsoft i ma tylko dwie opcje mówienia po angielsku poza USA.
Braina Pro ma znacznie lepszy wewnętrzny głos online, co nasuwa oczywiste pytanie, dlaczego nie używa tego do odczytywania tekstu?
Ostatnią cechą jest tryb dyktowania, który, jak wnioskuje, zamienia wypowiadane słowa na tekst.
Jeśli uruchomienie Notatnika z Braina Pro nie zrobi na Tobie wrażenia, przygotuj się na szok. Ponieważ możliwości transkrypcji tego narzędzia są na zupełnie innym poziomie.
Transkrypcja zasilana AI
Wiele narzędzi transkrypcyjnych obsługuje przyzwoitą liczbę języków i regionalnych odmian języków używanych w różnych krajach. Braina rozumie ponad 100 języków, w tym takie, które nie są często obsługiwane, np. Zulu, tajski, litewski i afrikaans.
Szeroki zakres języków Braina ujawnia złożoność tego rozwiązania. Ale najbardziej zaskoczyło nas to, że prawie od samego początku potrafił nas zrozumieć bez żadnych trudności.
Aby korzystać z tego narzędzia w dowolnej aplikacji lub witrynie internetowej, wystarczy aktywować mikrofon, a następnie poinformować oprogramowanie, że chcesz włączyć tryb dyktowania.
Jedynym problemem, na jaki natknęliśmy się, było to, że jeśli Braina usłyszy obce słowo z mikrofonu, doda je do dokumentu.
Braina twierdzi, że dokładność wynosi 99% i jesteśmy dość pewni, że nie przesadzają, w końcu w testach z języka angielskiego, które przeprowadziliśmy. Nie przeszkadzają mu też dźwięki w tle, takie jak dźwięk klimatyzacji czy wentylatora.
Ostatnim elementem tej układanki jest darmowe narzędzie (darowizny) o nazwie VB-CABLE, wirtualne rozwiązanie kablowe, które można podłączyć i przełączyć wyjście głośnika na linię mikrofonu.
Po zainstalowaniu i skonfigurowaniu tego systemu można odtwarzać dowolny plik audio lub wideo i zlecić Brainie transkrypcję dźwięków, które słyszy.
Oglądanie tego w akcji jest fascynujące. Kiedy po raz pierwszy uruchomiliśmy go na jednym z naszych testowych plików audio, założyliśmy, że robi kompletny bałagan przy zrozumieniu.
Z wyjątkiem tego, że plik był odtwarzany, zauważyliśmy, że wcześnie nieprawidłowo zidentyfikowane słowa i frazy zaczęły się subtelnie zmieniać, a im dłużej trwał dźwięk, tym był lepszy. Dopiero po kilku minutach nagrania było prawie dokładnie tak, jak trzeba.
Ta zdolność Brainy do ulepszania swojego modelu przez słuchanie jest spektakularna, ponieważ może zastosować to do tego, co już usłyszała i szybko poprawić dokładność.
Wadą korzystania z tego rozwiązania do transkrypcji nagrań jest to, że nie koduje czasowo słów ani nie identyfikuje mówiącego, więc nie można go praktycznie wykorzystać do tworzenia napisów wideo ani żadnych prac, które wymagają podziału na moment wypowiedzenia fraz.
To wielka szkoda, a Braina powinna poważnie rozważyć oferowanie przetwarzania plików audio jako jednej ze standardowych funkcji z kodem czasowym i możliwością generowania sformatowanych plików z napisami.
Dla tych, którzy chcą odkryć pełny zakres tego, co potrafi Braina, można rozpocząć podstawową rozmowę z AI, podczas której możesz zadawać jej pytania, a następnie zobaczyć, jak dostosowuje się do odpowiedzi.
Jeśli zadasz mu pytanie, na które nie zna odpowiedzi, może poprosić Cię o podanie informacji, które przechowuje, a następnie może przedstawić, jeśli pytanie zostanie ponownie zadane.
Warto zauważyć, że nie jest to odniesienie globalne, ale tworzenie konkretnej wiedzy na temat instalacji, umożliwiającej lokalne dostrojenie Braina Pro.
Jeśli będzie go używać wiele osób, można użyć różnych profili, aby uniknąć nakładania się danych modelu głosu, który buduje system.
Aplikacja na Androida
To, że aplikacja na Androida jest bezpłatna, ma dla Brainasoft doskonały sens ekonomiczny, ponieważ bez licencji na wersję PC narzędzie to jest całkowicie bezcelowe.
Zapewnia środki do zdalnego sterowania komputerem za pomocą głosu, wirtualnej myszy i klawiatury. Chociaż to, jak przydatne byłoby to, jest ograniczone w tym, że nie widać ekranu.
Aby połączyć się z lokalnym adresem IP komputera hosta, należy znać, co sprawia, że jest bardzo prawdopodobne, że nie zadziała, jeśli jesteś z dala od biura lub po drugiej stronie zapory.
Dlatego prawdziwą wartością tego oprogramowania jest to, że umożliwia ono używanie telefonu jako mikrofonu w komputerze bez podłączonego sprzętu.
Aplikacja na Androida nie jest funkcją, którą uważalibyśmy za mocną stronę Braina Pro, ale może być przydatna dla niektórych osób.
Ostateczny werdykt
Ogólnie rzecz biorąc, Braina Pro to coś dziwnego. Oferuje wiele funkcji oferowanych przez inne rozwiązania, w tym wbudowane w systemy Windows i Android. Oprócz tego jest kilka niezwykłych sztuczek, które nie są częścią systemu Windows i są imponujące.
Najważniejsze jest to, że sztuczna inteligencja stojąca za rozpoznawaniem głosu jest bardzo silna i przy niewielkim wysiłku lub treningu można uzyskać system dyktowania, który osiąga niezwykle wysoki poziom dokładności.
Nie spędzanie więcej czasu na naprawianiu błędów niż na dyktowaniu z pewnością sprawia, że jest to praktyczne rozwiązanie dla osoby, która musi szybko i skutecznie zebrać wiele pomysłów lub treści.
Ta funkcja przyćmiewa resztę, a biorąc pod uwagę liczbę osobistych asystentów dostępnych dla systemu Windows, nie jesteśmy pewni, dlaczego Braina próbuje z nimi konkurować.
Jest również bardzo przystępny cenowo, ponieważ możesz dyktować tyle, ile chcesz, za niewielką roczną opłatę lub dożywotnią licencję.
Jedynymi znaczącymi zastrzeżeniami dla Braina Pro jest to, że działa tylko w systemie Windows, a nie na Macu lub Linuksie, a połączenie internetowe musi być dostępne, aby działał. Jedna lub obie te kwestie mogą sprawić, że będzie ona mniej przydatna dla dziennikarzy, którzy w przeciwnym razie byliby zapalonymi użytkownikami.
Nie zniechęcaj się starszym stylem lub niedrogim charakterem tego narzędzia. Jest ono lepsze niż wiele rozwiązań z wysokimi miesięcznymi kosztami subskrypcji lub usługami transkrypcji rozliczanymi za minutę.
- Podkreśliliśmy również najlepsze usługi transkrypcji