Розшифровка фонограми: досвід та інструменти

Доброго дня вам, друзі!

Дехто з вас вже знає, що 12 травня я imageзахистив кандидатську дисертацію зі спеціальності 05.13.06 – Інформаційні технології. Проте, захист – це лише одна з зупинок на шляху до наукового ступеня – ще треба оформити документи та подати їх у дві інстанції – УкрІНТЕІ та МОН, тож святкувати ще раноSad smile 

Оскільки я чув, що більшість здобувачів надовго “зависають” на етапі підготовки стенограми, я вирішив зробити це наступного ж дня. І зробив – вже наступної після захисту ночі (о другій годині, якщо чесно) все було готово.

Як виявилось, розшифровка фонограми – процедура не така легка, як мені уявлялось, тож добре, що я почав з підбору необхідних для цього інструментів. Саме ними я й хочу з вами поділитись.


Вихідні дані

Тож що ми маємо на руках після захисту? В моєму випадку – це аудіозапис, який я зробив своїм телефоном, плюс, фонограма, зроблена господарями – співробітниками НАУ “ХАІ”, – яка виявилась дійсно дуже якісною, тож я використовував переважно її, а свою відкривав лише один чи два рази аби впевнитись, що я правильно почув якесь окреме слово.

Також у мене були фотографії записів, зроблених під час захисту моїм науковим керівником, та секретарем кафедри, яку він попросив окремо і детально занотувати запитання членів ради, за що я йому надзвичайно вдячнийSmile.

Також я мав два PDF-файли з відгуками офіційних опонентів (зображення, не текст) – звідти треба дістати перелік зауважень до дисертації.

Думаю, ви вже зрозуміли, що стенограма захисту – документ монументальний, який включає не лише розшифровку фонограми, але й вміст відгуків та рішення спеціалізованої вченої ради, тож підійти до її оформлення слід відповідально та у всеозброєнні.

 

Інструменти

Програмних засобів для автоматичного перетворення аудіозапису в текст, звісно ж, вистачає, однак, “якість” результуючого тексту іноді може вас шокувати – редагувати доведеться практично стільки ж, як і за умови запису “на слух”Sad smile

Саме з цієї причини у більшості випадків обирають другий варіант – транскрайбінг, або транскрибацію – тобто прослуховування аудіозапису з паралельним набором тексту, або “набір на слух”. Здавалося б, тут все просто й підійде будь-який програвач MP3-файлів, однак, ні – відтворення запису доведеться багато разів зупиняти й поновлювати, “відмотуючи” кожного разу трохи назад. Таких програм – транскрайберів – існує досить багато, як платних, так і безкоштовних, і деякі з них дійсно непогані.

Однак, мені не хотілось нічого завантажувати й встановлювати, не хотілось засмічувати комп’ютер, тож я вирішив пошувати веб-інструмент. І знайшов! Тож, вітайте номер один у моєму списку.

1. oTranscribe

Це безкоштовний і відкритий веб-застосунок, доступний за адресою otranscribe.com, який надає всі необхідні можливості:

  • завантаження аудіо- або відеофайлів
  • зручне призупинення, відновлення відтворення та перемотка з використанням клавіатури
  • простий, але зручний текстовий редактор з можливостями мінімального форматування тексту та експорту в Markdown
  • і багато іншогоSmile

image

oTranscribe мені дуже сподобався – просто завантажуєш MP3-файл, і все – працюєш в його вікні, не перемикаючись весь час між плеєром та текстовим процесором!

2. Google Photosgoogle-photos-logo-vector-download

Оскільки я фотографував записки наукового керівника та секретаря, ці знімки автоматично потрапили з мого телефону до Google Photos, тож відкривав я їх звідти, там же кадрував (обрізав непотрібне) та мінімально редагував.

Не буду зараз зупинятись на можливостях цього чудового сервісу – ви ж усі користуєтесь Google Photos, чи не так?Smile

3. NewOCR

Відгуки офіційних опонентів до мене потрапили у вигляді PDF-файлів, до того ж – файлів, що містили зображення, а не текстSad smile Тому Word 2016, який чудово вміє перетворювати PDF на docx,  в цьому випадку виявився безсилим, треба було скористатись програмою розпізнавання тексту, або OCR.

image

Всі, звісно ж, пам’ятають про ABBYY FineReader або CuneiForm, однак, хотілось щоб безкоштовно, і “у хмарі” – не покидаючи улюбленого Chrome, тому я спробував кілька онлайнових OCR і зупинився на newOCR – цей сервіс був єдиним, який чудово впорався з текстом, написаним українською мовою. Інтерфейс – теж простий і зручний, до того ж, як і oTranscribe, виконаний з використанням Bootstrap. До речі, результат можна завантажити одразу у форматі doc.

4. Перекладач Googleimage

Цей сервіс теж не потребує зайвих слів, і я впевнений, що ним ви всі також постійно користуєтесь. Google Translator – це дійсно кращий перекладач, який є, мабуть, практично на кожному телефоні та планшеті. Його я використовував для того, щоб перекласти деякі слова з російської, коли не міг швидко зорієнтуватись як це сказати українською.

Тож, використавши ці веб-інструменти, я отримав текст, який потів вставив у Word і вже в ньому підготував файл стенограми у відповідності до всіх вимог. Вже в ніч з 13 на 14 травня документ був готовий, проте, як я вже говорив, це був тільки початок паперової роботи, яку ще й досі не завершеноSad smile

Що ж, на цьому в мене на сьогодні все. Бережіть себе!
До зустрічі за тиждень, друзі!

VN:F [1.7.2_963]
Рейтинг запису
Rating: 5.0/5 (3 votes cast)

Ви можете відслідковувати коментарі до цього запису за допомогою RSS 2.0. Ви можете лишити коментар, або використати трекбек з Вашого сайту.

1 коментар »

 
 

Лишити коментар

XHTML: Ви можете використати наступні HTML-теги <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

 Допомогти блогу та заохотити автора:

BTC: 16XCs3A2mrfG3pWDbgsQofE83zrizx68Jm

XMR: 4z7DhWqm2eAny1EaC5ny5U3yspQA2wgPGnatvsto9WHeWas6wTpfBZK4kuxnhbxToKouJTYXoMtcVT5Td2hxiQVFEWgMez

KRB: KbbpHAZ41RFBf5ErK7VzpuNQJfZaMcfYoNhLQCHW95cfWWUZedaLFkb92yejTCS9JvJb1PckeZuWfHapya4qL3bZ7kPSEVL