Розшифровка фонограми: досвід та інструменти
Доброго дня вам, друзі!
Дехто з вас вже знає, що 12 травня я захистив кандидатську дисертацію зі спеціальності 05.13.06 – Інформаційні технології. Проте, захист – це лише одна з зупинок на шляху до наукового ступеня – ще треба оформити документи та подати їх у дві інстанції – УкрІНТЕІ та МОН, тож святкувати ще рано
Оскільки я чув, що більшість здобувачів надовго “зависають” на етапі підготовки стенограми, я вирішив зробити це наступного ж дня. І зробив – вже наступної після захисту ночі (о другій годині, якщо чесно) все було готово.
Як виявилось, розшифровка фонограми – процедура не така легка, як мені уявлялось, тож добре, що я почав з підбору необхідних для цього інструментів. Саме ними я й хочу з вами поділитись.
Вихідні дані
Тож що ми маємо на руках після захисту? В моєму випадку – це аудіозапис, який я зробив своїм телефоном, плюс, фонограма, зроблена господарями – співробітниками НАУ “ХАІ”, – яка виявилась дійсно дуже якісною, тож я використовував переважно її, а свою відкривав лише один чи два рази аби впевнитись, що я правильно почув якесь окреме слово.
Також у мене були фотографії записів, зроблених під час захисту моїм науковим керівником, та секретарем кафедри, яку він попросив окремо і детально занотувати запитання членів ради, за що я йому надзвичайно вдячний.
Також я мав два PDF-файли з відгуками офіційних опонентів (зображення, не текст) – звідти треба дістати перелік зауважень до дисертації.
Думаю, ви вже зрозуміли, що стенограма захисту – документ монументальний, який включає не лише розшифровку фонограми, але й вміст відгуків та рішення спеціалізованої вченої ради, тож підійти до її оформлення слід відповідально та у всеозброєнні.
Інструменти
Програмних засобів для автоматичного перетворення аудіозапису в текст, звісно ж, вистачає, однак, “якість” результуючого тексту іноді може вас шокувати – редагувати доведеться практично стільки ж, як і за умови запису “на слух”
Саме з цієї причини у більшості випадків обирають другий варіант – транскрайбінг, або транскрибацію – тобто прослуховування аудіозапису з паралельним набором тексту, або “набір на слух”. Здавалося б, тут все просто й підійде будь-який програвач MP3-файлів, однак, ні – відтворення запису доведеться багато разів зупиняти й поновлювати, “відмотуючи” кожного разу трохи назад. Таких програм – транскрайберів – існує досить багато, як платних, так і безкоштовних, і деякі з них дійсно непогані.
Однак, мені не хотілось нічого завантажувати й встановлювати, не хотілось засмічувати комп’ютер, тож я вирішив пошувати веб-інструмент. І знайшов! Тож, вітайте номер один у моєму списку.
1. oTranscribe
Це безкоштовний і відкритий веб-застосунок, доступний за адресою otranscribe.com, який надає всі необхідні можливості:
-
завантаження аудіо- або відеофайлів
-
зручне призупинення, відновлення відтворення та перемотка з використанням клавіатури
-
простий, але зручний текстовий редактор з можливостями мінімального форматування тексту та експорту в Markdown
-
і багато іншого
oTranscribe мені дуже сподобався – просто завантажуєш MP3-файл, і все – працюєш в його вікні, не перемикаючись весь час між плеєром та текстовим процесором!
2. Google Photos
Оскільки я фотографував записки наукового керівника та секретаря, ці знімки автоматично потрапили з мого телефону до Google Photos, тож відкривав я їх звідти, там же кадрував (обрізав непотрібне) та мінімально редагував.
Не буду зараз зупинятись на можливостях цього чудового сервісу – ви ж усі користуєтесь Google Photos, чи не так?
3. NewOCR
Відгуки офіційних опонентів до мене потрапили у вигляді PDF-файлів, до того ж – файлів, що містили зображення, а не текст Тому Word 2016, який чудово вміє перетворювати PDF на docx, в цьому випадку виявився безсилим, треба було скористатись програмою розпізнавання тексту, або OCR.
Всі, звісно ж, пам’ятають про ABBYY FineReader або CuneiForm, однак, хотілось щоб безкоштовно, і “у хмарі” – не покидаючи улюбленого Chrome, тому я спробував кілька онлайнових OCR і зупинився на newOCR – цей сервіс був єдиним, який чудово впорався з текстом, написаним українською мовою. Інтерфейс – теж простий і зручний, до того ж, як і oTranscribe, виконаний з використанням Bootstrap. До речі, результат можна завантажити одразу у форматі doc.
4. Перекладач Google
Цей сервіс теж не потребує зайвих слів, і я впевнений, що ним ви всі також постійно користуєтесь. Google Translator – це дійсно кращий перекладач, який є, мабуть, практично на кожному телефоні та планшеті. Його я використовував для того, щоб перекласти деякі слова з російської, коли не міг швидко зорієнтуватись як це сказати українською.
Тож, використавши ці веб-інструменти, я отримав текст, який потів вставив у Word і вже в ньому підготував файл стенограми у відповідності до всіх вимог. Вже в ніч з 13 на 14 травня документ був готовий, проте, як я вже говорив, це був тільки початок паперової роботи, яку ще й досі не завершено…
Що ж, на цьому в мене на сьогодні все. Бережіть себе!
До зустрічі за тиждень, друзі!
Ви можете відслідковувати коментарі до цього запису за допомогою RSS 2.0. Ви можете лишити коментар, або використати трекбек з Вашого сайту.
hi sir
very nice article
i am inspire with you and
keep up the good work