Красавина Е.А., Чойнзонов Е.Л., Кульбакин Д.Е., Балацкая Л.Н. Оценка эффективности восстановления речи больных раком орофарингеальной области. Head and neck.Голова и шея. Российский журнал.. 2024;12(2):39–46
Целью настоящего исследования явилась апробация метода речевой компьютерной диагностики для объективной оценки эффективности логовосстановительной терапии больных раком орофарингеальной области после хирургического лечения.
Материал и методы. Исследование носило проспективный характер и выполнялось на базе отделения опу- холей головы и шеи НИИ онкологии Томского НИМЦ. В исследование были включены 155 больных раком орофарингеальной области II–IV стадий опухолевого процесса в возрасте от 26 до 70 лет (Ме=51,6), проходивших хирургическое лечение и речевую реабилитацию в условиях данного отделения. Пациенты были разделены на 3 исследуемые группы в зависимости от объема хирургического вмешательства. В I исследуемую группу мы включили 70 больных с операцией в объеме гемиглоссэктомии без реконструктивно-пластического ком- понента, во II группу – 70 пациентов, которым выполнена гемиглоссэктомия с реконструктивно-пластическим компонентом (пластика подбородочными, лучевыми, медиальными суральными перфорантными лоскутами и кожно-фасциальными переднебоковыми лоскутами бедра), III группа – 15 пациентов после глоссэктомии с реконструктивно-пластическим компонентом (пластикой пекторальными лоскутами и кожно-мышечными перед- небоковыми лоскутами бедра с выполнением сосудистых анастомозов). Всем пациентам после верификации диагноза рака орофарингеальной области до начала комбинированного лечения выполнялась запись речи с использованием компьютерно-программного комплекса «OnkoSpeech v1.0». Данная запись является основой дальнейшей речевой диагностики, т.к. дает возможность создать эталон речи каждого пациента. Компьютерно- программный комплекс «OnkoSpeech v1.0» может оценивать произношения 6 фонем русского языка [К], [С], [Т], [Кь], [Сь], [Ть]. В своей работе мы использовали набор «ОнкоЯзык», который состоит из 90 слогов с учетом различных позиций фонем в слоге (в начале, в середине, в конце). В программу автоматически заносились все сеансы аудиозаписей и их текущая количественная оценка. Вторая запись речи выполнялась после хирургического этапа комбинированного лечения при поступлении пациентов на логовосстановительную терапию для оценки возникших нарушений произношения исследуемых фонем. Для оценки эффективности коррекции звукопроизношения выполнялась последняя запись речи после завершения этапа речевой реабилитации.
Результаты. Коррекция речевой функции выполнялась по методике, разработанной в отделении опухолей головы и шеи Томского НИИ онкологии. К занятиям приступали на 8–39-й день после операции (Me=23,2). Программу проведения речевой реабилитации составляли индивидуально для каждого больного в зави- симости от его общего состояния, возраста, объема оперативного вмешательства и результатов речевой компьютерной диагностики с использованием компьютерно-программного комплекса «OnkoSpeech v1.0». Логопедические занятия направлены на то, чтобы в оптимально короткие сроки после хирургического лече- ния восстановить речевую функцию пациентов путем активизации и координации движения губ, щек, культи языка, корня языка и нижней челюсти. По оценке, проведенной с помощью «OnkoSpeech v1.0», в результате логовосстановительной терапии у 100% пациентов отмечалось улучшение произношения всех шести фонем [К], [С], [Т], [Кь], [Сь], [Ть], данные были выражены в количественных показателях в сравнительном аспекте. Во II исследуемой группе больных после гемиглоссэктомии с реконструктивно-пластическим компонентом отмечались лучшие показатели по всем исследуемым фонемам.
Заключение. Речевая компьютерная диагностика с применением программного комплекса «OnkoSpeech v1.0» позволила количественно выразить нарушение произношения больных раком орофарингеальной области на этапах комбинированного лечения и речевой реабилитации. Применение речевой компьютерной диагностики дало возможность объективно оценить эффективность коррекции звукопроизношения 6 фонем в результате логовосстановительной терапии. Ключевые слова: рак орофарингеальной области, гемиглоссэктомия, глоссэктомия, восстановление речи, речевая компьютерная диагностика, объективная оценка речи, «OnkoSpeech v1.0»
Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Финансирование. Работа выполнена без спонсорской поддержки.
The aim of this study was to analyze the method of speech computer diagnostics for an objective assessment of the effectiveness of speech rehabilitation therapy in patients with oropharyngeal cancer after surgical treatment. Material and methods. The prospective study included 155 patients with stage II – IV oropharyngeal cancer, who underwent surgery and speech rehabilitation at the Head and Neck Cancer Department of Cancer Research Institute (Tomsk). The age range of the patients was from 26 to 70 years with a median of 52 years. The patients were divided into 3 groups depending on the extent of surgery. Group I included 70 patients who underwent hemiglossectomy without tongue defect reconstruction. Group II consisted of 70 patients who underwent hemiglossectomy with reconstructive surgery. For the reconstruction of hemiglossectomy defect, the submental, radial forearm free, and medial sural perforator flaps, as well as anterolateral thigh fasciocutaneous flap were used. Group III included 15 patients who underwent glossectomy and reconstruction with pectoralis flaps and musculocutaneous anterolateral thigh flaps. After verification of oropharyngeal cancer and before starting treatment, speech of all patients was recorded using the «OncoSpeech v1.0» computer software. This recording is the basis for further speech diagnostics, as it allows to create a speech standard for each patient. The «OncoSpeech v1.0» computer software can evaluate the pronunciation of six phonemes of the Russian language [К], [S], [Т], [К’], [С’], [Т’]. In our study, we used the OncoLanguage system, which consists of 90 syllables, taking into account the different positions of phonemes in a syllable (at the beginning, in the middle, at the end). All sessions of audio recordings and their current quantitative assessment were automatically uploaded into the program. The second speech recording was performed after surgery when patients were admitted to speech rehabilitation therapy to assess the resulting pronunciation disorders of the studied phonemes. To assess the effectiveness of sound pronunciation correction, the last speech recording was performed after the completion of speech rehabilitation. Results. The speech function correction was performed on days 8 -39 after surgery according to the method developed in the Head and Neck Cancer Department of Tomsk Cancer Research Institute. The program of speech rehabilitation was compiled individually for each patient, depending on the patient’s health condition, age, extent of surgery and the results of speech computer diagnostics using the «OncoSpeech v1.0» computer software. Speech therapy was aimed at restoring the speech function of patients in the shortest time after surgery by activating and coordinating the movement of the lips, cheeks, stump of the tongue, root of the tongue and the lower jaw. The improvement in pronunciation of all six phonemes [К], [S], [Т], [К’], [S’], [Т’] was observed in 100% of patients. The data were expressed in quantitative values in a comparative aspect. The best values for all studied phonemes were observed in group II patients who underwent hemiglossectomy with reconstructive surgery. Conclusion. Speech diagnostics using the OncoSpeech v1.0 software package made it possible to quantitatively express the violation of the pronunciation in patients with oropharyngeal cancer as well as to objectively evaluate the effectiveness of the correction of the sound pronunciation of six phonemes. Key words: oropharyngeal cancer, hemiglossectomy, glossectomy, speech restoration, speech computer diagnostics, objective speech assessment, «OncoSpeech v1.0» Conflicts of interest. The authors have no conflicts of interest to declare. Funding. There was no funding for this study
Основной характеристикой состояния больных раком орофарин- геальной области в послеоперационном периоде является выра- женная деформация речевого аппарата. Во время хирургического вмешательства удаляются ткани языка, мышц дна полости рта, небных дужек, нижней челюсти [1]. Вследствие этого нарушаются не только акты глотания и жевания пищи, но и речевая функция. Изменение положения и целостности органов артикуляции при- водит к развитию полиморфной дислалии и изменению акустики звучной речи. Поэтому после проведения комбинированного лече- ния перед онкологами стоит не менее важная задача – полноценная речевая реабилитация пролеченных больных [2]. Значительную трудность при речевой реабилитации больных данной категории вызывает оценка качества речи пациентов, потому что возникшие дефекты носят сочетанный характер, т.к. возникают из-за нарушения подвижности и положения в полости рта культи или реконструированного языка, изменений резонаторов и проявляются в нарушении произношения звуков речи, а также и качественных характеристик – просодии, моду- ляции и других, которые трудно охарактеризовать с помощью субъективных методов. При оценке возникших нарушений необходимо учитывать различные аспекты речевой функции как акустические, так и артикуляционные. В настоящее время оценка количественной и качественной характеристик нарушений выполняется на основе субъективных методов: с помощью групп экспертов, число кото- рых, по данным литературы, варьируется от 1 до 160 человек [3–5]. Однако средствами субъективных методик оценки не представляется возможным точно измерить все аспекты речевой функции. Поэтому разработка и внедрение количественных методов речевой диагностики с применением компьютерных технологий являются необходимостью для объективной оценки динамики речевой функции на этапах ее восстановления. Целью нашего исследования являлось разработка и апроба- ция количественного метода речевой компьютерной диагно- стики для объективной оценки эффективности логовосстано- вительной терапии больных раком орофарингеальной области. Материал и методы Исследование носило проспективный характер и проходи- ло на базе отделения опухолей головы и шеи НИИ онколо- гии Томского НИМЦ с 2014 по 2021 г. Речевую компьютерную диагностику прошли 155 больных раком орофарингеальной области II–IV стадий опухолевого процесса в возрасте от 26 до 70 лет (Ме=51,6), которым в плане комбинированного лечения выполнялось оперативное вмешательство. В зависимости от объема хирургического лечения мы разделили больных на 3 группы. В I группу включили 70 больных, которым в плане комбинированного лечения, была выполнена операция в объеме гемиглоссэктомии без реконструктивно-пластического компо- нента. Во II группу – 70 пациентов, после гемиглоссэктомии с реконструктивно-пластическим компонентом пластика выпол- нялась подбородочным, лучевым, медиальным суральным пер- форантным лоскутами и кожно-фасциальным переднебоковым лоскутом бедра. В III группу – 15 пациентов, после глоссэктомии с реконструктивно-пластическим компонентом с пластикой пекторальным лоскутом и кожно-мышечным переднебоковым лоскутом бедра с выполнением сосудистых анастамозов. Восстановление речевой функции всех пациентов проводи- лось по методике с применением акустического анализа речевых сигналов (проспективно) [6]. Методика восстановления речевой функции больных раком орофарингеальной области после хирургического этапа комби- нированного лечения включает в себя 5 этапов: 1 этап. Речевая диагностика с помощью компьютерно-про- граммного «OnkoSpeech v1.0» комплекса для акустического анализа речевых сигналов и формирования параметрического описания нарушений звукопроизношения в различные сроки восстановления речевой функции. 2 этап. Рациональная психотерапия. 3 этап. Дыхательные упражнения. 4 этап. Активизация нервно-мышечного аппарата органов артикуляции (артикуляционные упражнения для мышц щек, губ и языка). 5 этап. Коррекция нарушений звукопроизношения. В отделении опухолей головы и шеи НИИ онкологии Томского НИМЦ для объективной оценки речевой функции после опера- ций у больных раком орофарингеальной области установлен компьютерно-программный комплекс «OnkoSpeech v1.0» для акустического анализа речевых сигналов. Это совместная раз- работка социалистов Томского НИИ онкологии и лаборатории «теории распознавания и синтеза речи» Томского университета систем управления и радиоэлектроник. Программный комплекс «OnkoSpeech v1.0» может оцени- вать произношения 6 фонем русского языка [К], [С], [Т], [Кь], [Сь], [Ть]. С этой целью сформированы наборы слогов на основе учета различных позиций фонем в слоге: «ОнкоЯзык», «ОнкоЯзыкНК», «ОнкоЯзыкН». В своей работе мы использовали «ОнкоЯзык», данный набор состоит из 90 слогов и включает по 5 вариантов слогов с положением каждой фонемы в начале, середине и в конце слога. База данных программы включала индивидуальные карты пациентов, в которые заносили информацию о диагнозе, дате и объеме хирургического вмешательства, осложнениях, а также все сеансы аудиозаписей и их текущая количественная оценка (рис. 1). Программный комплекс позволял проводить записи сеанса речевой диагностики в автоматизированном режиме. Для этого создавали сеанс и указывали его тип (набор слогов для запи- си), и начинали запись сеанса. Если возникала необходимость оценить сеанс при записи речи, обязательно указывался сеанс, который использовали в качестве эталонного. За эталонные брали сеансы, проведенные до начала комбинированного лече- ния. Они отражали тот уровень качества произношения слогов, которого необходимо достичь в процессе реабилитации. При записи слогов на экране пациенту демонстрировался слог и его транскрипция, а по аудиоканалу через наушники пример произношения этого слога (рис. 2). Переключение между сло гами осуществилось на основе анализа звукового потока (если голос уже прозвучал, и в настоящий момент голоса нет, то слог переключался), т.е. после произношения слога пациентом программа автоматически переключалась на следующий слог. Программный комплекс также позволял выполнять как оценку слогов в процессе записи, так и оценку существующих сеансов. Для оценки сеанса необходимо наличие одного или двух эталон- ных сеансов. Предпочтительно наличие двух эталонных сеансов, т.к. в этом случае учитывалась вариативность произношения фонем в слоге (рис. 3). Для записей тех слогов, в которых проблемная фонема расположена в начальной позиции, доступна автоматическая сегментация. Обобщенный алгоритм оценки при наличии двух эталонных сеансов представляет собой следующую последо- вательность действий: 1. Выбор первого слога в одном или двух эталонных сеансах. 2. Преобразование пары эталонных слогов к единой длине, нахо- ждение меры различия между эталонными произношениями. 3. Попарное преобразование оцениваемого слога к первому и второму эталонным слогам, нахождение меры различия в каждой паре. 4. Нахождение среднего значения для пар оцениваемый-эта- лонный слог. 5. Нахождение отношения полученного среднего значения к мере различия между эталонными слогами. Заключение полученного значения к промежутку от 0 до 1. Пункты 1–5 повторяются для всех записей слогов в сеансе. Чем ближе оценка слога к 1, тем ближе к эталонному, качественнее произнесен слог. Оценку сеанса получали путем нахождения среднего арифметического значения оценок всех записей слогов, входящих в сеанс. При проведении оценки в процессе записи подсчет осуществляли сразу же после записи слога. Полученную оценку выводили на экран в поле «Оценка». При нажатии кнопки «Завершить запись» все полученные оценки, а также подсчитанную по итогам записи оценку сеанса заносили в базу данных. При оценке сеанса сначала подсчи- тывали все оценки, затем выводили на экран и проводили оценку сеанса. Оценка сеанса автоматически вносились в базу данных, оценки слогов сохранялись по нажатию клавиши «Сохранить» (рис. 4). Речевая диагностика проводилась: – до начала комбинированного лечения, после верификации диагноза; – после хирургического лечения в начале реабилитационных мероприятий; – после завершения этапа речевой реабилитации. Результаты и обсуждение Основным условием для проведения речевой компьютерной диагностики являлось создание эталонного сеанса речи паци- ента. Поэтому при поступлении больного в стационар после верификации опухолевого процесса и определения тактики комбинированного лечения, логопед проводила первую беседу, во время которой рассказывала о возможности послеоперацион- ного восстановления речевой функции и делала первую запись речи больного с применением компьютерно-программного ком- плекса «OnkoSpeech v1.0». Таким образом, создавался эталон речи каждого пациента, который брался за единицу и отражал индивидуальные особенности речевой функции и тот уровень качества произношения слогов, которого необходимо достичь в процессе логовосстановительной терапии. К восстановлению речевой функции приступали после снятия швов и удаления носопищеводного зонда. Начало логопеди- ческих занятий зависело от заживления послеоперационной раны, сроки ее начала варьировались от 8 до 39 дней (Me=23,2). Необходимым условием являлся совместный осмотр пациента хирургом-онкологом и логопедом. У больных, перенесших хирургическое лечение рака орофа- рингеальной области, отмечалось сложное по структуре наруше ние речи, которое характеризовалось не только расстройством звукопроизношения, но и просодии, темпа, плавности, гром- кости речи, высоты и тембра голоса, акцентуации и мелодики. Для оценки степени нарушений звукопроизношения выполняли вторую запись речи пациентов (табл.). Результаты оценки сеансов показали более низкие показатели в I и III исследуемых группах, т.е. у больных после гемиглос- сэктомии без реконструктивно-пластического компонента и у больных после глоссэктомии с реконструктивно-пластическим компонентом отмечались более выраженные нарушения оцени- ваемых фонем, чем во II исследуемой группе. Следует отметить, что самая большая степень нарушения произношения оценива- емых фонем наблюдалась в III исследуемой группе (больные после глоссэктомии), что явилось ожидаемым, поскольку у больных данной исследуемой группы был выполнен больший объем хирургического вмешательства. Обратили на себя внимание показатели нарушения свистящих звуков [С] и [Сь], они были больше выражены в I исследуемой группе. Причиной этого было положение культи языка в поло- сти рта, которое не дает возможность правильному движению воздуха при произнесении звуков [С] и [Сь]. Данные звуки в русском языке характеризуются как шумные, глухие и образу- ются с помощью выдыхаемой из легких воздушной струи, без участия голоса. Основное значение имеет правильное направ- ление воздушной струи. В норме при образовании указанных звуков выдыхаемая струя воздуха проходит по желобку языка (посередине языка) и через резцы направлена вниз. Указанный артикуляционный уклад невозможен при указанном объеме хирургического вмешательства. Логопедические занятия проводили перед большим зер- калом, чтобы пациент мог видеть себя и логопеда. Занятия начинали с выполнения упражнений дыхательной гимнастики, далее переходили к артикуляционным упражнениям для мышц щек, губ и языка. Целью данных упражнений являлась акти- визация и координация артикуляционного аппарата пациента. Как только удавалось достичь точности и плавности движений, переходили к этапу коррекции звукопроизношения. Один раз в день больной занимался с логопедом и 2–3 раза выпол- нял комплекс упражнений самостоятельно. Длительность и интенсивность занятий зависели от общего состояния, объема оперативного вмешательства, возраста, нервно-психическо- го состояния, профессии, трудовой направленности. Сроки логовосстановительной терапии варьировались от 10 до 28 дней (Me=21,8). После окончания логопедических занятий выполнялась запись речи пациентов для оценки коррекции нарушений произношения фонем русского языка [К], [С], [Т], [Кь] [Сь] [Ть] в результате проведенных логопедических занятий. Следует отметить, что результаты речевой компьютерной диагностики представили количественное улучшение по всем шести исследуемым фонемам во всех группах. Положительная динамика восстановления указанных фонем наблюдалась в 100% случаев (табл.). Лучшие показатели были достигнуты во II исследуемой группе (больные после гемиглоссэктомии с реконструктивно-пластическим компонентом). Заключение Таким образом, речевая компьютерная диагностика с приме- нением программного комплекса «OnkoSpeech v1.0» позволила количественно выразить нарушение произношения больных раком орофарингеальной области на этапах комбинированного лечения и речевой реабилитации. Применение речевой ком- пьютерной диагностики дало возможность объективно оценить эффективность проводимой коррекции звукопроизношения 6 фонем в результате логовосстановительной терапии.