Классификация характера: 8. Характер. Классификация черт характера. Типы характера. Акцентуация характера.

Содержание

📖 Классификация черт характера, § 5. Характер, Глава 7 Психология личности. Юридическая психология. С основами общей и социальной психологии. Еникеев М. И. Страница 45. Читать онлайн

§ 5. Характер


Классификация черт характера

Все многообразие проявлений характера подразделяется на четыре группы по следующим основаниям: 1) направленность индивида, система его отношений в социуме; 2) особенности волевой регуляции; 3) эмоциональные особенности; 4) интеллектуальные особенности.

В системе отношений человека выделяются четыре разновидности: отношение человека к обществу, к себе, к труду и продуктам труда.

Отношение человека к обществу, другим людям определяет фундаментальное качество характера человека, его нравственность.

Нравственность — моральное сознание индивида, реализуемое в его поведении, подчиненность поведения индивида социальным нормам, эталонам и ценностям. Уровень нравственности личности определяется мерой совпадения общесоциальных и внутренне мотивационных требований к ее поведению. (И. Кант, как известно, более всего удивлялся двум явлениям бытия — звездному небу над головой и нравственному закону внутри нас.) Нравственность — свободное самопринуждение личности к социально адаптированному, социально ценному поведению.

Понятие нравственности — понятие, пограничное между социологией, этикой и психологией В социологическом аспекте оно связано с понятием общественных нравов, функционированием социальных норм, регулирующих поведение социума. По своей психологической сущности нравственность — система стереотипизированных форм поведения, основанная на интернализации (присвоении) социальных норм и ценностей. Нравственность личности — основной показатель ее социализированности, социальной самоидентификации.

Нравственность в целом — это поведенческая культура общества. Нравственность индивида — мера его приобщения к этой культуре. Общечеловеческие стандарты нравственности отвечают объективным условиям человеческого общежития, базовым потребностям человечества.

Формирование нравственности связано с культурно-историческими традициями данного общества, уровнем социального контроля и социальных ожиданий.

В этическом плане нравственность индивида— сфера его моральных отношений с другими людьми, классифицируемая по содержанию и форме.

По содержанию моральные отношения индивидов подразделяются исходя из их социальных обязанностей (гражданские, трудовые, семейные, профессиональные и др.). Специфические нравственные обязанности возникают по отношению к людям, находящимся в особом положении (к детям, престарелым, больным, остронуждающимся), к людям, с которыми индивид находится в особых отношениях (к родителям, детям, друзьям, любимым).

Ряд нравственных требований индивид обязан предъявлять к себе как к определенной самоценности (гордость, самоуважение и др.).

Нравственное самоусовершенствование индивида — один из основных смыслов его бытия. Система высших моральных требований личности образует его нравственный идеал. Нравственность индивида — это духовное преодоление трудностей бытия.

Одним из высших проявлений человеческой духовности является сострадание к другим людям (альтруизм), готовность к самоограничению и даже самоотречению для блага других людей. Способность к самоподавлению эгоистических побуждений — одно из высших проявлений человеческой сущности. Категорическим императивом (безусловным требованием), «золотым правилом» поведения человека является требование: относись к людям, как к самому себе; блага одних людей не могут быть оплачены страданием других.

Принятая индивидом система отношений к другим людям может сводиться к четырем основным схемам.

1. «Я хороший и все люди хорошие» — ценностно-ориентировочная схема, присущая социально адаптированным личностям, отличающимся доброжелательностью, высокой социальной коммуникативностью, жизнерадостностью, адекватным уровнем притязаний, психической устойчивостью в трудных ситуациях.

Это высокосоциализированный, психически устойчивый тип личности. Системообразующими качествами его характера, а следовательно, и поведения являются социальная идентифицированность, альтруизм, обостренное чувство социальной ответственности. Поведение такой личности характеризуется открытостью, честностью, последовательностью.

2. «Я плохой, а все люди хорошие» — жизненная схема, присущая людям с пониженным уровнем притязаний, нерешительным, постоянно сомневающимся в своих возможностях, проявляющим психическую неустойчивость в трудных ситуациях, затрудняющимся в установлении социальных контактов. Как правило, это люди со слабым типом нервной деятельности.

3. «Я хороший, а все люди плохие» — схема, присущая людям с завышенным уровнем притязаний. Высокомерие, эгоизм, твердость, переходящая в жестокость, присвоение себе права к исключительным поступкам — таковы отличительные черты характера людей данной ориентации.

4. «Я плохой и все люди плохие» — такова позиция неисправимых пессимистов, ожидающих от жизни одних неприятностей. Как и предыдущий тип, этот тип социальной ориентации порождает конфликты личности с социальной средой. Но в отличие от третьего жизненного сценария данный сценарий ведет не к самоутверждению, а к самодемобилизации, уходу от радостей жизни, а иногда и из самой жизни. Не надеясь на лучшее в реальной жизни, человек с такой жизненной концепцией уходит в мир грез, бесплодных мечтаний и нереальных надежд.

У каждого человека существует установка по отношению к самому себе — Я-концепция.

Наряду с реальным Я существует Я идеальное и Я динамическое, саморазвивающееся.

Человек познает себя во взаимодействии с другими людьми, находящимися на различных социально-культурных уровнях. И если референтная (эталонная) для данной личности социальная группа имеет объективно высокий статус, то это стимулирует личность к саморазвитию.

Человек строит свои жизненные стратегии, взвешивая различные альтернативы, составляя композиции возможных действий. Этот внутренний диалог — основной механизм саморегуляции: человек как бы смотрит на себя со стороны, с позиций других людей. Он формулирует приемлемые для себя компромиссы, выдвигает самооправдательные мотивы, примеряет свой внутренний мир к реальной действительности.

Однако чем менее социализирован индивид, тем менее мучителен его диалог с самим собой. Этого диалога может и не быть. Тогда индивид, по существу, перестает быть человеком. Отсутствие внутренней жизни, системы критических самооценок, нищета духа, крайний примитивизм при санкционировании ответственных решений— таков уровень самосознания большинства злостных преступников. Внешние действия, не апробированные внутренней работой духа, приобретают бездуховную энергетику, проявляясь в жестокости, садизме и насилии.

У социализированной личности возникают проблемы примирения, согласования внутреннего и внешнего мира. Как согласовать преданность своим принципам с противоречивыми требованиями жизни? В этих ситуациях и проявляется характер человека — его твердость и пластичность, гражданское мужество и толерантность.

Отношение личности к труду и другим видам деятельности обусловливает трудолюбие, преодоление трудностей в работе, добросовестность и др. Эта группа отношений также включает в себя склонности, призвание и талант как характерологические качества личности. К негативным качествам данной группы относятся тунеядство, праздность, бродяжничество и др.

Отношение к вещам как продуктам человеческого труда выражается в аккуратности, бережливости и др. В этой группе некоторые качества характера носят криминогенный характер: корыстность, жадность, безмерное потребительство, неудержимое влечение к стандартам «роскошной жизни».

Ценностные ориентации индивида в известной мере определяют и волевую регуляцию его поведения.

Волевые черты характера — устойчивые индивидуально-типологические особенности сознательной регуляции поведения. Наиболее существенна способность индивида в трудных, конфликтных обстоятельствах своевременно принимать обоснованные решения и исполнять их. Решительность выражается также в способности человека прекратить выполнение действия при изменении обстановки, когда оно перестает быть целесообразным.

Противоположное качество — нерешительность, проявляю — щаяся в излишних колебаниях, затягивании принятия решения или излишней поспешности решения, когда человек стремится избежать напряжения, связанного с борьбой мотивов.

Особенно важны такие качества человека, как выдержка и самообладание — способность индивида контролировать свое поведение в сложных конфликтных условиях, воздерживаться от ненужных действий, контролировать свои эмоции и чувства, не допускать импульсивных действий, регулировать настроение, не терять присутствие духа в трудных и даже опасных ситуациях, стойко переносить лишения, неудачи, физические страдания.

В жизни каждого человека существенны смелость и мужество. Противостоящие им отрицательные качества — трусость, малодушие, пренебрежение принципами и моральными чувствами в опасных ситуациях.

Волевые особенности личности определяют основные качества характера: цельность, силу, твердость и уравновешенность.

Цельность характера — устойчивость личностных позиций в различных ситуациях, согласованность слов и поступков; сила характера — энергичность человека, способность к длительному напряжению, преодолению трудностей в сложных ситуациях; твердость характера — сила характера в сочетании с личностной принципиальностью; уравновешенность характера— ровность, сдержанность поведения, эмоционально-волевая устойчивость личности.

Волевая саморегуляция индивида определяется иерархизированностью и динамичностью его мотивационной сферы.

Существенно, чтобы побуждения низшего уровня подчинялись более высоким побуждениям. Индивид должен обладать хорошо отработанными средствами подавления низменных побуждений. Иерархизированность мотивационной сферы индивида зависит от того, какие мотивы и в каких ситуациях актуализировались особенно часто и сильно.

Эмоциональные особенности характера индивида — наиболее наглядный, непосредственно воспринимаемый индикатор его психических свойств. Человек проявляется в том, что его смешит и радует, заставляет восторгаться и печалит, что вызывает у него гнев и стресс и что заставляет его успокаиваться и приходить в умиление.

Эмоции, как уже отмечалось, — это непосредственная, импульсивная реакция индивида на значимые для него воздействия. Эмоции — непроизвольные реакции индивида на акты удовлетворения или неудовлетворения его потребностей.

Они вступают в свои права в любой внезапно возникающей жизненно значимой ситуации, мобилизуя резервы психической и физической энергии.

По эмоциональным особенностям своего характера индивиды отличаются рядом параметров: эмоциональной реактивностью, глубиной, длительностью и устойчивостью эмоциональных процессов, доминирующими чувствами и их предметной отнесенностью. Эмоциональный настрой индивида — показатель тонуса всей его жизнедеятельности.

Характерологический облик индивида в значительной мере определяется его экстернальностью (внешненаправленной ориентацией) и интернальностью (внутринаправленной ориентацией).

Ориентированные на внешний успех индивиды предпочитают те виды деятельности, которые ведут к быстрому получению престижного результата. Для них характерен повышенный уровень притязаний, а во многих случаях — дефекты самокритичности, нравственной принципиальности.

Индивиды-интерналы отличаются повышенной требовательностью к себе, более тонким самоанализом, а в ряде случаев — излишней робостью и нерешительностью. Они всячески избегают ситуаций, в которых возможны поведенческие неудачи, личностные утраты.

Это высокотревожные индивиды, они особенно чувствительны к опасным ситуациям, склонны к дезорганизации своего поведения в этих ситуациях.

Эмоциональность индивида характеризуется содержанием, качеством и динамикой его эмоциональных процессов.

Содержательная сторона эмоциональной сферы индивида определяется его ценностными ориентациями.

Качественная сторона эмоций свидетельствует о преимущественной положительной или отрицательной модальности присущих данному индивиду эмоциональных состояний.

К динамическим эмоциональным свойствам индивида относятся особенности возникновения, протекания и прекращения эмоциональных процессов, их внешнее проявление — экспрессия.

По эмоциональным реакциям личности можно судить о тонких нюансах ее животрепещущих связей с действительностью.

По эмоциональным качествам различаются натуры импрес- сивные (эмоционально впечатлительные), сентиментальные (повышенная пассивно-созерцательная эмоциональность), экспрессивные (повышенная эмоциональность, связанная с бурной, стремительной деятельностью) и малоэмоциональные.

Психология bookap

Интеллектуальные черты характера — устойчивые индивидуально-типологические особенности интеллекта.

По интеллектуальным качествам различаются натуры с теоретическим или практическим складом ума, различной степенью гибкости и глубины интеллекта, быстротой протекания мыслительных процессов.

Что такое классификация изображений?—ArcGIS Help

Доступно с лицензией Spatial Analyst.

Классификация изображений – это процесс извлечения классов информации из многоканального растрового изображения. Растр, полученный в результате классификации изображения, можно использовать для создания тематических карт. В зависимости от характера взаимодействия аналитика с компьютером в процессе классификации, различают два типа классификации изображений: классификацию с обучением и классификацию без обучения.

В группе инструментов Многомерный анализ (Multivariate) ArcGIS Spatial Analyst содержится полный набор инструментов для классификации с обучением и без обучения (см. Обзор группы инструментов Многомерность). Процесс классификации – это многошаговый рабочий процесс, поэтому предусмотрена специальная панель инструментов Классификация изображений (Image Classification), обеспечивающая интегрированную среду классификации с использованием различных инструментов. Панель инструментов служит не только для выполнения рабочего процесса классификации с обучением и без обучения, но и предоставляет дополнительные функции для анализа входных данных, создания обучающих выборок и файлов сигнатур, а также оценки качества обучающих выборок и файлов сигнатур. Для выполнения классификации и многомерного анализа рекомендуется использовать панель инструментов Классификация изображений (Image Classification).

Классификация с обучением

В классификации изображений с обучением используются спектральные сигнатуры, полученные из обучающих выборок. С помощью панели инструментов Классификация изображений (Image Classification) вы можете легко создать обучающие выборки, соответствующие классам, которые нужно извлечь. Вы можете также легко создать из обучающих выборок файл сигнатур, который затем будет использоваться инструментами многомерной классификации для классификации изображения.

Классификация без обучения

Процесс классификации без обучения находит спектральные классы (или кластеры) в многоканальном изображении без вмешательства аналитика. Для выполнения классификации без обучения на панели инструментов Классификация изображений (Image Classification) имеются инструменты для создания кластеров, анализа их качества, а также инструменты классификации.

Пример

В примере ниже панель инструментов Классификация изображений (Image Classification) использована для классификации снимка, сделанного спутником Landsat TM.

Исходный спутниковый снимок – это четырехканальный снимок спутника Landsat TM на территорию северной части г. Цинциннати, штат Огайо.

Входной снимок Landsat TM

С помощью панели инструментов в спутниковом снимке были выделены пять классов землепользования: Коммерческое/Промышленное (Commercial/Industrial), Жилое (Residential), Пашни (Cropland), Леса (Forest) и Пастбища (Pasture).

Обучающие выборки

Качество обучающих выборок было проанализировано с помощью инструментов оценки обучающих выборок в Менеджере обучающих выборок (Training Sample Manager).

Оценка обучающих выборок

С помощью панели инструментов Классификация изображений (Image Classification) и Менеджера обучающих выборок (Training Sample Manager) было установлено, что обучающие выборки являются репрезентативными и статистически различимыми. Поэтому с помощью панели инструментов была выполнена классификация по методу максимального правдоподобия. После очистки классифицированного изображения была получена окончательная карта землепользования, показанная ниже.

Выходная классифицированная карта землепользования

Связанные разделы

Презентация на тему «Классификация характера» по психологии

Слайд 16

В начальных классах школы оформляются черты характера, проявляющиеся в отношениях с людьми. Этому способствует расширение сферы общения ребенка с окружающими за счет множества новых школьных друзей, а также учителей. Если то, что ребенок как личность приобрел в домашних условиях, получает в школе поддержку, то соответствующие черты характера у него закрепляются и чаще всего сохраняются в течение всей дальнейшей жизни. Если же вновь получаемый опыт общения со сверстниками и учителями не подтверждает как правильные те формы поведения, которые ребенок приобрел дома, то начинается постепенная ломка характера, которая обычно сопровождается выраженными внутренними и внешними конфликтами. Происходящая при этом перестройка характера не всегда приводит к положительному результату. Чаще всего имеет место частичное изменение черт характера и компромисс между тем, к чему приучали ребенка дома, и тем, что от него требует школа. В подростковом возрасте активно развиваются и закрепляются волевые черты характера, а в ранней юности формируются базовые нравственные, мировоззренческие основы личности. К окончанию школы характер человека можно считать в основном сложившимся, и то, что происходит с ним в дальнейшем, почти никогда не делает характер человека неузнаваемым для тех, кто с ним общался в школьные годы. Следует отметить, что характер не является застывшим образованием, а формируется и трансформируется на протяжении всего жизненного пути человека. Характер не является фатально предопределенным. Хотя он и обусловлен объективными обстоятельствами жизненного пути человека, сами эти обстоятельства изменяются под влиянием поступков человека. Поэтому после окончания учебного заведения характер человека продолжает формироваться или видоизменяться. На данном этапе человек сам является творцом своего характера, поскольку характер складывается в зависимости от мировоззрения, убеждений и привычек нравственного поведения, которые вырабатывает у себя человек, от дел и поступков, которые он совершает, от всей его сознательной деятельности. Этот процесс в современной психологической литературе рассматривается как процесс самовоспитания. Самовоспитание характера предполагает, что человек способен освободиться от излишнего самомнения, может критически посмотреть на себя, увидеть свои недостатки. Это позволит ему определить цель работы над собой, т. е. те черты характера, от которых бы он хотел избавиться или, наоборот, которые хотел бы выработать у себя. Тот, кто хочет учиться, всегда найдет, на кого ему равняться. Пример для подражания не обязательно должен быть реальным. Это может быть киногерой или герой литературного произведения, отличающийся глубокой принципиальностью и исключительной твердостью характера, герой войны, передовой ученый и т. д. Кроме этого, особое значение в формировании характера принадлежит общественной деятельности человека, активное участие в которой развивает чувство ответственности перед коллективом, способствует развитию организованности, выдержки, чувства долга. Наиболее эффективным средством формирования характера является труд. Сильными характерами обладают люди, ставящие перед собой большие задачи в работе, настойчиво добивающиеся их решения, преодолевающие всестоящие на пути к достижению этих целей препятствия, осуществляющие систематический контроль за выполнением намеченного. Поэтому мы вправе утверждать, что характер, как и другие черты личности, формируется в деятельности.

Виды изданий по целевому назначению, характеру информации, объёму и повторности выпуска

3.2.8.1

официальное издание: Издание, публикуемое от имени государственных органов, учреждений, ведомств или общественных организаций, содержащее материалы нормативного или директивного характера.

Примечание – Официальное издание, содержащее нормы, правила и требования в разных сферах производственной деятельности, именуется нормативным производственно-практическим изданием.

3.2.8.2

научное издание: Издание, содержащее результаты теоретических и (или) экспериментальных исследований, а также научно подготовленные к публикации памятники культуры и исторические документы.

3.2.8.3

научно-популярное издание: Издание, содержащее сведения о теоретических и (или) экспериментальных исследованиях в области науки, культуры и техники, изложенные в форме, доступной читателю неспециалисту.

3.2.8.4

популярное издание: Издание, предназначенное для удовлетворения непрофессиональных интересов широких кругов читателей в одной или нескольких специальных областей знания.

3.2.8.5

словарно-энциклопедическое издание: Издание, содержащее основную, верифицированную, системно организованную информацию по отраслям знания, имеющее главной целью не только передачу, но и сохранение такой информации

3.2.8.6

учебное издание: Издание, содержащее систематизированные сведения научного или прикладного характера, изложенные в форме, удобной для изучения и преподавания, и рассчитанное на учащихся разного возраста и ступени обучения

Примечание – Учебное издание, допущенное к использованию при реализации программ общего и высшего образования, проходит официальное утверждение в профильных ведомствах.

3.2.8.7

литературно-художественное издание: Издание, содержащее произведение (я) художественной литературы.

3.2.8.8

духовно-просветительное издание: Издание религиозного содержания, разъясняющее постулаты мировоззрения, основанного на вере в существование высших божественных сил.

3.2.8.9

производственно-практическое издание: Издание, содержащее сведения по технологии, технике и организации производства, а также других областей общественной практики, рассчитанное на специалистов различной квалификации.

3.2.8.10

нормативное производственно-практическое издание: Официальное издание, содержащее нормы, правила и требования в разных сферах производственной деятельности

3.2.8.11

массово-политическое издание: Издание, содержащее произведение общественно-политической тематики, агитационно-пропагандистского характера и предназначенное широким кругам читателей

3.2.8.12

справочное издание: Издание, содержащее сведения научного и/или прикладного характера, расположенные в порядке, удобном для их быстрого отыскания

3.2.8.13

информационное издание: Издание, содержащее систематизированные сведения о документах (опубликованных, неопубликованных, непубликуемых) либо результат анализа и обобщения сведений, представленных в первоисточниках.

3.2.8.14

рекламное издание: Издание, специализирующееся на информации, направленной на привлечение внимания к какому-либо объекту для формирования или поддержки интереса к нему, либо его продвижения на рынке.

Примечание – В выходных сведениях такого издания должна содержаться информация о его рекламной специализации.

3.2.8.15

издание для досуга, досуговое издание: Издание, содержащее общедоступные сведения по организации быта, разнообразным формам самодеятельного творчества, различным видам увлечений

Типология акцентуаций характера у подростков Текст научной статьи по специальности «Психологические науки»

УДК 159.9.07

ТИПОЛОГИЯ АКЦЕНТУАЦИЙ ХАРАКТЕРА У ПОДРОСТКОВ

Бадиев Игорь Валерьевич

преподаватель кафедры возрастной и педагогической психологии Бурятского государственного университета

Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а E-mail: [email protected]

В статье представлены результаты исследования взаимосвязи эмоциональных и волевых свойств подростков с типом акцентуации характера. Рассматриваются основные подходы к изучению характера, проблемы его определения и операционализации, связи со смежными категориями. Характер определяется как устойчивый способ эмоционально-волевого реагирования индивида на среду. Данное определение противопоставляется пониманию характера как морально-этической оценки личности. Таким образом, мы полагаем, что характер можно определить через эмоциональные и волевые свойства. Под акцентуацией характера понимается чрезмерно выраженная черта характера, которая делает индивида уязвимым к специфическим воздействиям. В исследовании мы опираемся на типологию акцентуаций характера А. Е. Личко. Недостатком типологического подхода к изучению характера является отсутствие единого основания для их классификации. В работе впервые осуществлена попытка соотнести типологию акцентуаций характера с эмоционально-волевыми свойствами в качестве основания таксономии характеров. В ходе исследования выявлены степени выраженности эмоциональных и волевых свойств подростков с определенными типами акцентуаций характера, приведены описания данных типов в контексте эмоционально-волевого реагирования, в противовес описанию типичных поведенческих реакций. Ключевые слова: акцентуация характера, эмоциональные свойства, волевые качества, таксономия характеров, эмоционально-волевое реагирование, подростковый возраст.

TYPOLOGY OF ADOLESCENTS’ CHARACTER ACCENTUATIONS

Igor V. Badiev

Senior Lecturer, Buryat State University 24a, Smolina Str., 670000 Ulan-Ude, Russia

The article presented the results of studying correlation of emotional and volitional characteristics of adolescents with a character accentuation type. The main approaches to character studying, problems of its definition and operationalization, connection with other categories were considered. Character was defined as sustainable ways of emotional and volitional response of an individual to environment. This definition is opposed to understanding of character as moral and ethical evaluation of an individual. Thus, we believe that character could be determined through emotional and volitional qualities. Accentuation of character mean excessively expressed trait that makes an individual vulnerable to specific influences. In the study, we relied on A. E. Lichko’s typology of character accentuations. The disadvantage of typological approach to character studying was a lack of common basis for accentuations classification. We first made an attempt to correlate character accentuations typology with emotional and volitional qualities as a base of characters taxonomy. During the study the severity of emotional and volitional characteristics of adolescents with certain types of character accentuations was revealed, the descriptions of these character accentuations types in the context of emotional and volitional response were given as opposed to description of typical behavioral reactions.

Keywords: character accentuation, emotional properties, volitional qualities, characters taxonomy.

Термин «акцентуация» как чрезмерно выраженная индивидуальная черта, имеющая тенденцию к переходу в патологическое состояние, был введен Карлом Леонгардом [1, с. 75]. Психолог выразил свое понимание акцентуированной личности: «Личности, обозначаемые нами как акцентуированные, не являются патологическими. При ином толковании мы бы вынуждены были прийти к выводу, что нормальным следует считать только среднего человека, а всякое отклонение от такой середины должны были бы признать патологией» [1, с. 75].

При каждом типе акцентуации характера личность человека может быть различной. Так, эпи-лептоид может быть и аморальным преступником, и борцом за свободу, и истово верующим, и ярым атеистом [2]. А. Е. Личко, развивая идею об акцентуациях, указывал, что «…правильнее было бы говорить не об акцентуированных личностях, а об акцентуациях характера. Личность — понятие более широкое, оно включает интеллект, способности, мировоззрение и т. п. Характер считается базисом

личности, он формируется в основном в подростковом возрасте, личность как целое — уже при го-взрослении. Именно типы характера, а не личности в целом описаны К. Леонгардом, именно особенности характера отличают в его описаниях один тип от другого» [3, с. 8].

Под акцентуацией характера А. Е. Личко понимал «крайние варианты его нормы, при которых отдельные черты характера чрезмерно усилены, отчего обнаруживается избирательная уязвимость в отношении определенного рода психогенных воздействий при хорошей и даже повышенной устойчивости к другим» [3, с. 9]. Таким образом, диагностическим критерием акцентуации характера явилось «место наименьшего сопротивления» [3, с. 8], то есть такое специфическое для определенного типа акцентуации характера психогенное воздействие, которое вызывает дезадаптив-ное поведение. При этом подросток с другим типом акцентуации может проявлять к данному воздействию повышенную устойчивость.

А. Е. Личко выделил следующие типы акцентуаций характера у подростков: 1 — гипертимный, 2 — циклоидный, 3 — лабильный, 4 — астено-невротический, 5 — психастенический, 6 — истероид-ный, 7 — эпилептоидный, 8 — шизоидный, 9 — сенситивный, 10 — неустойчивый, 11 — конформный. В своей монографии автор типологии указывает, что частота встречаемости акцентуаций характера среди популяции здоровых подростков в различных учебных заведениях, по данным Н. Я. Иванова, колеблется от 33 до 88 % [3].

При понимании под характером базиса личности, формирующийся в подростковом возрасте, возникает вопрос о тех конкретных психических феноменах, которые составляют характер, каковы его компоненты. С. Л. Рубинштейн определял характер следующим образом: «Черты характера — это те существенные свойства человека, из которых с определенной логикой и внутренней последовательностью вытекает одна линия поведения, одни поступки и которыми исключаются как несовместимые с ними, им противоречащие, другие» [4, с. 664]. Ю. Б. Гиппенрейтер определяет характер как «совокупность устойчивых свойств индивида, в которых выражаются способы его поведения и способы эмоционального реагирования» [5, с. 336].

Под характером мы будем понимать устойчивые способы реагирования человека на других людей в ситуациях обыденной жизни и в экстремальных ситуациях. Мы полагаем, что устойчивые способы реагирования формируются под влиянием эмоциональных и волевых свойств человека [6].

Нами была сформулирована задача установить, какие именно эмоциональные и волевые свойства определяют своеобразие проявлений конкретного типа акцентуации характера. Е. П. Ильин отнес к эмоциональным и волевым свойствам человека следующие проявления: эмоциональная возбудимость, глубина переживания эмоции, эмоциональная устойчивость, эмоциональная лабильность, оптимизм, эмоциональная отзывчивость, экспрессивность, терпеливость, упорство, настойчивость, смелость, решительность, выдержка [7, 8].

Определение степени выраженности тех или иных эмоциональных и волевых свойств акцентуированных подростков позволило дать нам описания типов акцентуаций характера, представленные ниже.

В исследовании приняли участие подростки в возрасте от 14 до 17 лет — ученики 9-11-х классов общеобразовательных школ. Нами были сформированы две возрастные группы: 50 мальчиков и 50 девочек в возрасте 14-15 лет, 50 мальчиков и 50 девочек в возрасте 16-17 лет, всего 200 подростков.

Тип акцентуации характера определялся с помощью патохарактерологического диагностического опросника, разработанного А. Е. Личко и его сотрудниками [4]. Эмоциональные и волевые свойства исследовались комплектом методик, включающим «Опросник для оценки терпеливости», «Опросник для оценки упорства», «Опросник для оценки настойчивости» Е. П. Ильина и Е. К. Фещенко [8], «Самооценка волевых качеств» Н. Е. Стамбуловой [8], «Характеристики эмоциональности» Е. П. Ильина [7], «Перцептивная самооценка парциальной и интегральной эмоциональной экспрессивности» Л. Е. Бачиной и А. Е. Ольшанниковой [9], тест на оптимизм «LOT» (Life orientation test) Ч. Шейера и М. Карвера [10], «Диагностика уровня эмпатии» М. И. Юсупова [9].

Оценка достоверности различий выраженности эмоционально-волевых свойств в различных типах акцентуаций характера осуществлялась однофакторным дисперсионным анализом ANOVA с последующим тестом гомогенных групп Дункана. Оценка достоверности различий в возрастных и гендерных группах также осуществлялась данным методом. Оценка согласия распределения типов акцентуаций характера относительно пола и возраста осуществлялась критерием хи-квадрат по Пирсону.

Процентное отношение типов акцентуаций характера в возрастных и тендерных группах представлено в таблице 1.

Таблица 1

Соотношение типов акцентуаций характера в возрастных и тендерных группах подростков (в %)

мальчики девочки

№ Тип акцентуации возраст

14-15 16-17 14-15 16-17

1 Гипертимный 18 20 14 24

2 Истероидный 0 10 12 12

3 Лабильный 14 10 22 24

4 Астено-невротический 0 0 0 0

5 Неустойчивый 4 4 2 2

6 Психастенический 6 8 8 16

7 Сензитивный 6 6 12 6

8 Шизоидный 10 10 16 4

9 Циклоидный 0 4 4 0

10 Эпилептоидный 30 20 10 10

11 Конформный 0 0 0 0

Всего акцентуаций 88 92 100 98

Мы сопоставили частоту встречаемости типов акцентуаций характера у мальчиков-подростков обеих возрастных групп с результатами Н. Я. Иванова, исследовавшего акцентуации характера среди подростков мужского пола — учащихся ПТУ в 1976 г. [3]. Данное сопоставление показало, что увеличилось количество акцентуированных подростков (73 % по данным Н. Я. Иванова, 90 % по результатам нашего исследования). Увеличилась частота встречаемости гипертимного типа акцентуации характера (8 и 19 %), психастенического (1 и 7 %), эпилептоидного (11 и 25 %). При этом уменьшилась частота встречаемости неустойчивого типа (21 и 4 %).

Исследование согласия распределений типов акцентуаций характера относительно пола подростков критерием хи-квадрат выявило значимые различия между мальчиками и девочками (р = 0,03). У мальчиков-подростков чаще диагностируется эпилептоидный тип акцентуации характера, у девочек-подростков — лабильный тип акцентуации характера. Относительно возраста значимых различий в распределении типов акцентуаций характера обнаружено не было.

Исследование выраженности эмоциональных и волевых свойств у мальчиков и девочек показало, что мальчики-подростки отличаются большей выраженностью волевых свойств, связанных с целеустремленностью и самообладанием для обеих возрастных групп. Для девочек-подростков обеих возрастных групп характерна большая выраженность эмоциональных свойств: они более эмоционально возбудимы, их эмоциональные переживания отличаются глубиной, эмоциональные состояния сохраняются дольше, и для возникновения эмоций требуется меньшее количество времени и силы действия эмоциогенного фактора. Для девочек характерно более оптимистическое восприятие мира, они свободнее выражают свои эмоции и легко откликаются на эмоциональные переживания окружающих.

Исследование выраженности эмоциональных и волевых свойств в возрастных группах не выявило значимых различий в выраженности волевых и эмоциональных свойств, таких как возбудимость, лабильность, интенсивность и устойчивость. При этом мальчики и девочки подростки в возрасте 14-15 лет отличаются в большей степени пессимистичными установками, у них слабее развита эмпатия, и они менее экспрессивны, чем подростки в возрасте 16-17 лет.

Эмоциональные и волевые свойства подростков с гипертимным типом акцентуации характера

Подростки с гипертимным типом акцентуации характера отличаются выраженным упорством, настойчивостью, смелостью и решительностью. Для возбуждения эмоций у таких подростков необходим эмоциогенный раздражитель достаточной силы, при этом эмоции легко сменяют друг друга, эмоциональные состояния не нарушают эффективность общения и деятельности, эмоциональный фон оценивается как преимущественно положительный.

Эмоциональные и волевые свойства подростков с циклоидным типом акцентуации характера

Циклоидные подростки характеризуются терпеливостью, сочетающейся со слабой настойчивостью и упорством, для возбуждения эмоциональных состояний необходим относительно слабый эмо-циогенный раздражитель, эмоции легко сменяют друг друга, при этом отрицательно влияют на эффективность общения и деятельности. Эмоциональные состояния слабо представлены в поведении, эмоциональный фон преимущественно отрицательный, эмпатия на низком уровне.

Эмоциональные и волевые свойства подростков с лабильным типом акцентуации характера

Лабильные подростки отличаются слабой переносимостью неблагоприятных условий, трудностью удержания длительного волевого усилия, слабостью волевого контроля эмоций защитного характера и нерешительностью. Эмоциональные состояния возникают при воздействии слабых эмоцио-генных раздражителей и отрицательно влияют на эффективность общения и деятельности. Эмоциональные состояния сильно выражены в поведении, лабильные подростки легко откликаются на эмоциональные состояния других людей. Эмоциональный фон существенный вклад не вносит, предположительно, в силу его нестабильности.

Эмоциональные и волевые свойства подростков с психастеническим типом акцентуации характера

Психастенические подростки отличаются слабой целеустремленностью и самообладанием, легкостью возникновения эмоциональных реакций и интенсивностью эмоциональных переживаний. Данные подростки эмоционально отзывчивые, эмоциональный фон преимущественно имеет тенденцию к положительному.

Эмоциональные и волевые свойства подростков с истероидным типом акцентуации характера

Истероидный подросток отличается способностью удерживать волевое усилие в долговременной перспективе, легкостью принятия решений, способностью подавлять защитные эмоциональные реакции. Эмоции легко сменяют друг друга, при этом не вредят эффективности общения и деятельности. Эмоциональные состояния сильно выражены в поведении, общий эмоциональный фон преимущественно положительный.

Эмоциональные и волевые свойства подростков с эпилептоидным типом акцентуации характера

Эпилептоидные подростки отличаются низкой способностью переносить неблагоприятные факторы, легко отказываются от краткосрочных целей в связи с возникшими трудностями, при этом легко подавляют импульсивные эмоциональные реакции. Для возбуждения эмоций необходим достаточно сильный эмоциогенный раздражитель, эмоции отличаются слабой интенсивностью. Можно предположить, что на уровне латентной акцентуации по эпилептоидному типу, подростки практически ничем не выделяются среди сверстников. «Точка наименьшего сопротивления» (возможность проявления деспотической власти в отношении других) таких подростков достаточно редко имеет место в условиях общеобразовательной школы. Следовательно, выраженность эмоциональных и волевых свойств данных подростков, полученных в результате исследования, отражает особенности эмоционально-волевого реагирования при стабильной адаптации.

Эмоциональные и волевые свойства подростков с шизоидным типом акцентуации характера

Шизоидные подростки могут длительное время переносить неблагоприятные факторы, удерживать волевое усилие как в долгосрочной, так и в краткосрочной перспективе, легко подавляют импульсивные порывы. Эмоциональные переживания достаточно глубоки, эмоции сохраняются длительное время и негативно сказываются на эффективности общения и деятельности. Эмоциональные состояния крайне слабо выражены в поведении, эмоциональный фон преимущественно снижен, выражена эмоциональная отзывчивость. Эмоциональная отзывчивость шизоидов является, вероятно,

опосредованной, при непосредственном восприятии эмоций других людей у шизоидов велика вероятность ошибки в их интерпретации. Таким образом, эмоциональная холодность шизоидов объясняется низкой экспрессивностью, сниженным эмоциональным фоном и выраженными волевыми свойствами.

Эмоциональные и волевые свойства подростков с сенситивным типом акцентуации характера

Сенситивные подростки отличаются нерешительностью, трудностью подавления как эмоциональных реакций защитного характера, так и импульсивных. Эмоции отличаются глубиной переживания, сохраняются длительное время и отрицательно сказываются на эффективности общения и деятельности. Им свойственны преимущественно пессимистические установки и слабая эмоциональная отзывчивость.

Эмоциональные и волевые свойства подростков с неустойчивым типом акцентуации характера

Неустойчивые подростки отличаются способностью длительное время переносить неблагоприятные воздействия, способностью удерживать волевое усилие как в кратковременной, так и в долговременной перспективе, способностью подавлять защитные и импульсивные эмоциональные реакции, легкостью принятия решения.

Таким образом, результатом нашего исследования явились описания содержательных характеристик взаимосвязи типов акцентуаций характеров подростков с эмоциональными и волевыми свойствами: эмоциональной возбудимостью, интенсивностью, эмоциональной устойчивостью, лабильностью, оптимизмом, эмоциональной отзывчивостью, экспрессивностью, терпеливостью, упорством, настойчивостью, смелостью, решительностью, выдержкой. Мы можем говорить о том, что выраженность тех или иных эмоционально-волевых свойств достаточно устойчива в определенном типе акцентуации характера и может послужить основанием таксономии характеров.

Литература

1. Леонгард К. Акцентуированные личности / пер. В. М. Лещинская. — Ростов-н/Д.: Феникс, 2QQQ. —

541 с.

2. Личко А. Е. Акцентуации характера как концепция в психиатрии и медицинской психологии // Обозрение психиатрии и медицинской психологии им. В. М. Бехтерева. — 1993. — № 1. — С. 5-17.

3. Личко А. Е. Психопатии и акцентуации характера у подростков: патохарактерологический диагностический опросник для подростков (ПДО). — СПб.: Речь, 2Q13. — 251 с.

4. Рубинштейн С. Л. Основы общей психологии. — СПб.; Харьков; Минск; М.: Питер, 2QQQ. — 712 с.

5. Гиппенрейтер Ю. Б., Романова В. Я. Темперамент, характер, личность: проблемы и решения / Психология индивидуальных различий. — 3-е изд., испр. и доп. — М., 2QQ8. — С. 331-354.

6. Бадиев И. В. К проблеме определения характера // Вестник НГУ. Сер. Психология. — 2Q11. — Т. 5, вып. 1. — С. 1Q9-111.

7. Ильин Е. П. Эмоции и чувства. — СПб.: Питер, 2QQ1. — 749 с.

8. Ильин Е. П. Психология воли. — 2-е изд., перераб. и доп. — СПб.: Питер, 2QQ9. — 364 с.

9. Фетискин Н. П., Козлов В. В., Мануйлов Г. М. Социально-психологическая диагностика развития личности и малых групп : учеб. пособие. — М.: Психотерапия, 2QQ9. — 539 с.

1Q. Сычев О. А. Психология оптимизма: учеб.-метод. пособие. — Бийск: БПГУ, 2QQ8. — 69 с.

References

1. Leonhard K. Akzentuierte Persönlichkeiten [Accentuated personalities]. Berlin, 1976. 328 p. (Ger.)

2. Lichko A. E. Aktsentuatsii kharaktera kak kontseptsiya v psikhiatrii i meditsinskoi psikhologii [Accentuation of character as a concept in psychiatry and medical psychology]. Obozrenie psikhiatrii i meditsinskoi psikhologii im. V. M. Bekhtereva — Bekhterev Review of Psychiatry and Medical Psychology. 1993. No. 1. Pp. 5-17.

3. Lichko A. E. Psikhopatii i aktsentuatsii kharaktera u podrostkov: patokharakterologicheskii diagnosticheskii oprosnik dlya podrostkov (PDO) [Psychopathy and character accentuations of adolescents: Pathocharacterological diagnostic questionnaire for adolescents (PDQ)]. St Petersburg: Rech’, 2Q13. 251 p.

4. Rubinshtein S. L. Osnovy obshchei psikhologii [Basics of general psychology]. St Petersburg; Khar’kov; Minsk; Moscow, 2QQQ. 712 p.

5. Gippenreiter Yu. B., Romanova V. Ya. Temperament, kharakter, lichnost’: Problemy i resheniya [Temperament, character, personality: Problems and Solutions]. Psikhologiya individual’nykh razlichii — Psychology of individual differences. Moscow, 2QQ8. Pp. 331-354.

6. Badiev I. V. K probleme opredeleniya kharaktera [To the problem of character determining]. VestnikNovosi-birskogo gosudarstvennogo universiteta. Seriya: Psikhologiya — Bulletin of Novosibirsk State University. Series: Psychology. Bk 5. V. 1, 2Q11. Pp. 1Q9-111.

7. Il’inE. P. Emotsii i chuvstva [Emotions and feelings]. St Petersburg: Piter, 2001. 749 p.

8. Il’in E. P. Psikhologiya voli [Psychology of will]. St Petersburg: Piter, 364 p.

9. Fetiskin N. P., Kozlov V. V., Manuilov G. M. Sotsial’no-psikhologicheskaya diagnostika razvitiya lichnosti i malykh grupp [Socio-psychological diagnosis of personality and small groups development]. Moscow: Psikhoterapiya, 2009. 539 p.

10. Sychev O. A. Psikhologiya optimizma [Psychology of optimism]. Bijsk: Bijsk Pedagogical State University publ., 2008. 69 p.

База знаний ТЕХНОНИКОЛЬ — Классификация стен

Стены могут разделяться по:

  • назначению
  • типу воспринимаемых нагрузок
  • конструктивному решению
  • материалу
  • способу возведения

Классификация стен по назначению:

  • наружные
  • внутренние

Классификация стен по конструктивному решению:

  • монолитные
  • мелко- и крупноблочные
  • панельные и щитовые
  • каркасные
  • сборные
  • комбинированные

Классификация стен по восприятию нагрузок:

  • несущие
  • самонесущие
  • ненесущие

Классификация стен по материалу:

  • каменные
  • бетонные
  • деревянные
  • из синтетических материалов

Классификация стен по способу возведения:

  • сборные
  • монолитные


Несущие стены

Отличить несущую стену от ненесущей достаточно просто. Несущие стены — воспринимающие кроме нагрузок от собственного веса и ветра также нагрузки от покрытий, перекрытий, кранов и т. п.

Эта стена в буквальном смысле «несет» на себе определенную нагрузку. Если вы мысленно удалите ее из конструкции здания, и такое удаление нарушит целостность здания, значит, стена несущая.


Самонесущие стены

Самонесущие – воспринимающие нагрузку только от собственного веса стен всех вышележащих этажей зданий, а также ветровую нагрузку.


Ненесущие стены

Ненесущие (в том числе навесные) — воспринимающие нагрузку только от собственного веса и ветра в пределах одного этажа при высоте этажа не более 6 м (при большей высоте этажа эти стены относятся к самонесущим).

В том случае, если определение конкретного вида стены все же вызывает затруднения, лучше всего проконсультироваться у специалиста.


Была ли статья полезна?

Природные пожары — Муниципальное образование Литейный округ (№79)

Сегодня, в век технического прогресса, развития науки и технологии в мире происходит множество различного рода аварий, катастроф, непременно связанных с гибелью людей, с разрушением материальных ценностей, с возникновением серьезных нарушений экологии и т. д.

Все более актуальной становиться тема чрезвычайных ситуаций природного характера. Число наводнений, землетрясений, извержений вулканов увеличивается с каждым годом, в них погибает все большее количество людей.

К чрезвычайным ситуациям природного характера относятся природные пожары. Лесные пожары — одна из серьезнейших проблем российских лесов. В последнее время общая площадь лесов несоизмеримо сокращается. И одна из причин такого сокращения — лесные и торфяные пожары. В настоящее время ежегодно возникает множество лесных пожаров, увеличиваются и катастрофические вспышки лесных и торфяных пожаров. Вред, который они приносят человечеству, огромен, особенно если учитывать не только прямой, но и косвенный ущерб. Пожар — стихийное (неуправляемое) горение, распространившееся на лесную площадь, окруженную не горящей территорией. В лесную площадь, по которой распространяется пожар, входят и открытые лесные пространства. К одному пожару относится вся пройденная огнем площадь, окружена не горящей в данный момент территорией.

Общие сведения о природных пожарах

Пожар, который происходит в условиях окружающей природной среды, называется природным.

В понятие природные пожары входят лесные пожары, пожары степных и хлебных массивов, торфяные и подземные пожары горючих ископаемых. К наиболее распространенным природным явлениям, приводящим к уничтожению лесных массивов и других материальных ценностей, а порой и человеческим жертвам, относятся лесные пожары. Статистика показывает, что они возникают в 8 — 10% случаев стихийно, а в 90% случаев по вине человека.

В России в среднем ежегодно выгорает от 30 до 50 тысяч га лесов. В зависимости от характера возгорания и состава леса пожары подразделяют на низовые, верховые, почвенные. Почти все они в начале своего развития носят характер низовых и, если создаются определенные условия, переходят в верховые и почвенные.

Важнейшими характеристиками являются скорость распространения низовых и верховых пожаров, глубина прогорания подземных. Пожары делятся на слабые, средние и сильные. По скорости распространения огня низовые и верховые подразделяются на устойчивые и беглые. Скорость распространения слабого низового пожара не превышает 1м/мин, среднего — от1 до 3 м/мин, сильного — свыше 3 м/мин… Слабый верховой имеет скорость до 3 м/мин., средний до 100 м/мин., а сильный — свыше 100 м/мин… Слабым подземным считается такой пожар, у которого глубина прогорания не превышает 25 см., средним — от 25 до 50 см., сильным — более 50 см…

Природные пожары относятся к числу очень опасных и часто повторяющихся ЧС. Они приводят к уничтожению лесных массивов, гибели животных и растений, нарушению теплового баланса в зоне пожара, загрязнению атмосферы продуктами горения, к эрозии почвы. Нередко природные пожары являются причиной травмирования, заболеваний, гибели людей.

Причины возникновения пожаров

Источником возникновения природных пожаров могут явиться естественные причины: разряд молнии, самовозгорание, трение деревьев. В подавляющем большинстве случаев природные пожары являются следствием нарушения человеком требований пожарной безопасности. Примерно 60-70% природных пожаров возникает в радиусе 5 километров от населенных пунктов. В этой зоне чаще всего люди проводят время “на природе”.

Основные причины возникновения природных пожаров: непотушенная сигарета, горящая спичка, тлеющий пыж после выстрела, масленые тряпки или ветошь, стеклянная бутылка, преломляющая лучи солнечного света, искры из глушителя транспортного средства, сжигание старой травы, стерни, мусора вблизи леса или торфяника, расчистка с помощью огня лесных площадей для сельскохозяйственного использования или обустройство лесных пастбищ. Одним из основных потенциальных источников природных пожаров является костер. В ряде случаев природные пожары становятся следствием умышленного поджога, техногенной аварии или катастрофы.

Запреты с целью недопущения пожара в природной среде:

— бросать в лесу горящие спички, окурки, тлеющие тряпки;

— разводить костер в густых зарослях и в хвойном молодняке, под низко свисающими кронами деревьев, рядом со складами древесины, торфа, в непосредственной близости от созревших сельхозкультур;

— оставлять в лесу самовозгораемые материалы: тряпки и ветошь, пропитанные маслом, бензином, стеклянную посуду, которая в солнечную погоду может сфокусировать солнечный луч и воспламенить сухую растительность;

— выжигать сухую траву на лесных полянах, в садах, на полях, под деревьями;

— поджигать камыш;

— разводить костер в ветреную погоду и оставлять его без присмотра;

— оставлять костер горящим после покидания стоянки.

При обнаружении природного пожара постарайтесь ликвидировать очаг возгорания собственными силами; если это не удалось сделать, быстро покиньте опасную зону, обязательно сообщите о месте пожара в лесную охрану, администрацию, милицию, Службу спасения.

Классификация природных пожаров

К природным пожарам относятся лесные, степные, торфяные, подземные, а также возможные их комбинации.

Лесные пожары

Лесной пожар – это неконтролируемое горение растительности, стихийно распространяющееся по лесной территории. Явление очень быстрое и частое. Такие бедствия и возникающие в связи с ними ЧС происходят в различных регионах страны ежегодно и во многом зависят от поведения в лесу людей. Лесные пожары уничтожают деревья и кустарники, заготовленную в лесу продукцию, строения и сооружения. Ослабленные пожарами насаждения становятся очагами вредных заболеваний, что приводит к гибели не только пораженных огнем, но и соседних с ними посадок. В результате пожаров снижаются защитные, водоохранные и другие полезные свойства леса, уничтожаются ценная фауна, нарушается плановое ведение л/х и использование лесных ресурсов. До 80 % пожаров возникает из-за нарушения населением мер пожарной безопасности при обращении с огнем в местах труда и отдыха, а также в результате использования в лесу неисправной техники. В районах лесозаготовок лесные пожары возникают, главным образом, весной при очистке лесосек огневым способам — сжиганием порубочных остатков. Лесные пожары могут являться следствием недостаточно налаженной службы наблюдения за состоянием леса и несвоевременного оповещения соответствующих органов о возникших в лесу очагах пожаров и превращению их в массовые.

Чаще всего наблюдаются низовые пожары – около 90 % от их общего числа. В этом случае огонь распространяется только по надпочвенному покрову, охватывая нижние части стволов деревьев и выступающие на поверхность корни.

Низовые пожары подразделяются на беглые и устойчивые. при низовом беглом пожаре сгорает живой и мертвый надпочвенный покров, самосев лева, опавшие листья и хвоя, обгорают кора нижней части деревьев и обнаженные корни, хвойный подрост и подлесок. Такой пожар распространяется с большой скоростью, обходя места с повышенной влажностью покрова, поэтому часть площади остается незатронутой огнем. Беглые пожары чаще всего происходят весной, когда просыхает лишь самый верхний слой мелких горючих материалов.

При устойчивом низовом пожаре прогорает подстилка, сильно обгорают корни и кора деревьев, полностью сгорают подрост и подлесок. Обычно устойчивые пожары начинаются с середины лета, когда просыхает подстилка.

При низовом беглом пожаре преобладает пламенный тип горения, при устойчивом – беспламенный.

Различают верховой устойчивый и верховой беглый пожары. Особенно большой ущерб наносят верховые пожары, когда горят кроны деревьев верхнего яруса. Беглые верховые пожары характерны как для первой, так и для второй половины лета.

Анализируя причины возникновения и процесс развития лесных пожаров нетрудно заметить, что пожарная опасность в лесах существенно зависит от погодных условий, для прогнозирования которых в настоящее время имеются достаточно совершенные методы. Наибольшая вероятность возникновения лесных пожаров в пожароопасный сезон (апрель-ноябрь). Наибольшее влияние на пожарную опасность в лесу оказывают: осадки, температура воздуха и его влажность, ветер и облачность.

Торфяные пожары

Под воздействием температуры, влажности окружающей среды, биологической структуры растений торфообразователей и ряда других причин торф постепенно разлагается. Чем выше степень разложения торфа, тем больше подвержен он возгоранию. т.к. такой торф имеет меньшую влажность, большую среднюю плотность и теплоемкость. Скорость выгорания торфа в безветренную погоду или при слабом ветре составляет 0,18 кг/кв.м.

При скорости ветра 3 м/сек и болеенередко происходит разбрасывание горящих торфяных частиц по ветру на значительные расстояния. Искры, попадая на слой подсушенного торфа, находящегося на поверхности, поджигают этот слой и образуют новые очаги горения. Происходит распространение пожара по направлению ветра.

Перемещение огня по поверхности сплошной линией без учета очагов, образуемых разбрасываемыми ветром искрами, принято называть скоростью продвижения огня, а скорость перемещения огня с учетом очагов, образуемых от искр — скоростью распространения пожара.

В зависимости от скорости продвижения огня различают 4 фронта торфяного пожара:

— головной (основной), движущийся по направлению ветра с наибольшей скоростью;

— два боковых (фланговых), движущихся в стороны от головного фронта и с меньшей скоростью;

— тыльный, движущийся в сторону, противоположную направлению ветра (навстречу ветру), и с наименьшей скоростью.

Большое влияние на развитие торфяных пожаров оказывают время года и суток, а также метеорологические факторы. Ночью пожар развивается медленнее, т.к. температура поверхности торфа ниже температуры залежи, и вследствие этого влага поднимается в ее верхние слои. Кроме того, обычно ночью утихает ветер и выпадает роса.

Развитие торфяных пожаров можно разделить на три периода.

Первый – начальный – загорание торфа. Характеризуется малой площадью очага, небольшой скоростью горения, сравнительно низкой температурой и слабой задымленностью в зоне горения. Продолжительность периода загорания колеблется от нескольких минут до нескольких часов и зависит от влажности торфа, скорости ветра, температуры и относительной влажности воздуха.

Второй – характеризуется интенсивным горением с нарастанием его скорости и температуры. Быстро увеличивается площадь пожара, достигая нередко нескольких тысяч кв.м. Повышается температура окружающей среды, на большое расстояние распространяется дым.

Третий – пожар распространяется наиболее интенсивно и на весьма большой площади, ис числяемой несколькими гектарами. Пожар характеризуется высокой температурой в зоне горения и сильной задымленностью.

В очагах торфяных пожаров возникают завалы из подгоревших, упавших деревьев и полости выгоревшего торфа, в которые могут проваливаться люди и техника.

Подземные торфяные пожары сами по себе распространяются очень медленно и возникают обычно из низовых, при которых огонь заглубляется по всему пожарищу отдельными очагами. Поэтому первоочередная задача – тушение низового пожара. Затем приступают к ликвидации очагов подземного пожара. Для тушения подземных пожаров используют растворы химикатов или «мокрую» воду, подаваемую под давлением методом инъектирования вглубь торфяного слоя с помощью пожарных или поливомоечных машин, снабженных шлангами с перфорированными стволами – пиками. Локализовать подземные пожары можно также, создав вокруг них канавы с помощью канавокопателей, траншеекопателей, бульдозеров или взрывными методами. Глубина канав должна доходить до уровня грунтовых вод или достигать минерального грунта, заглубляясь в него на 20 см, т.е. она должна быть равна.

Внешний откос канав засыпают минеральным грунтом. Канавы при этом целесообразно наполнять водой. Учитывая, что кромка подземных пожаров заметна не везде, при тушении таких пожаров необходимо соблюдать осторожность, чтобы избежать попадания людей и машин в выгоревшие ямы или каверны.

Подземные пожары

Подземные пожары возникают в шахтах, на рудниках, массивах полезных ископаемых. Причиной их являются как внешние тепловые импульсы (неосторожное обращение с огнем, неисправность электрооборудования, трение движущихся деталей машин и механизмов), так и самовозгорание угля, углистых пород, сульфидных руд. Особую опасность представляют собой подземные пожары в местах скопления взрывоопасных веществ, в том числе метана, угольной и сульфидной пыли. Профилактика подземных пожаров и предупреждение их последствий заключаются в том, что наряду с общими пожарно-профилактическими мероприятиями (использование негорючих материалов для крепления горных выработок, трудновоспламеняемых конвейерных лент и электрических кабелей в негорючих оболочках, устройство разветвленной сети пожарного водопровода и др.). предусматривается применение специальных схем вскрытия и подготовки месторождений. Они позволяют локализовать участок в случае пожара и отвести пожарные газы в общешахтную исходящую струю воздуха, минуя остальные участки, на которых находятся люди.

Степные пожары

Степные пожары являются следствием возгорания сухой травы или зрелых посевов сельскохозяйственных культур и распространяются в ветреную погоду со скоростью до 120 км/ч.

Поражающие факторы пожаров

К основным поража¬ющим факторам можно отнести непосредственное воздействие огня (го¬рение), высокую температуру и теплоизлучение, газовую среду; задым¬ление и загазованность помещений и территории токсичными продук¬тами горения. Люди, находящиеся в зоне горения, больше всего страдают, как правило, от открытого огня и искр, повышенной темпе¬ратуры окружающей среды, токсичных продуктов горения, дыма, по¬ниженной концентрация кислорода.

Открытый огонь. Случаи непосредственного воздействия открытого огня на людей редки. Чаще всего поражение происходит от лучистых потоков, испускаемых пламенем. Температура среды. Наибольшую опасность для людей представляет вдыхание нагретого воздуха, приводящее к ожогу верх¬них дыхательных путей, удушью и смерти. Так, при температуре выше 100 °С человек теряет сознания и гибнет через несколько минут. Опас-ны также ожоги кожи.

Потеря видимости вследствие задымления. Успех эвакуации людей при пожаре может быть обеспечен лишь при их беспрепятственном движении. Эвакуируемые обязательно должны четко видеть эвакуационные выходы или указатели выходов. При потере видимости движение людей становится хаотичным. В результате этого процесса эвакуации затрудняется, а затем может стать неуправляемым.

Пониженная концентрация кислорода. В условиях пожара концентрация кислорода в воздухе уменьшается. Между тем понижение ее даже на 3 % вызывает ухудшение двигательных функций организма. Опасной считается концентрация менее 14 %; при ней нарушаются мозговая деятельность и координация движений.

Критерии пожаров

По официальной статистике, огнем охвачено до 2 миллионов гектаров леса в год, а по неофициальной — до 14 миллионов гектаров (это в 140 раз больше площади Москвы). Почему такая разница? Очень просто: примерно треть, то есть 200 из 600 миллионов гектаров российских лесов официально (!) находится вне зоны охраны от пожаров, и по этой территории нет даже достоверной статистики о количестве и площади пожаров. По остальной местности данные о пожарах тоже далеко не всегда достоверны.

Т Согласно официальным данным, около 67% лесных пожаров и 95% пройденной огнем площади лесов пришлось на 24 субъекта РФ. Это Читинская, Иркутская, Амурская, Белгородская, Рязанская, Воронежская, Архангельская, Волгоградская, Ростовская, Нижегородская, Ульяновская области, республики Коми, Тыва, Бурятия, Хакасия, Краснодарский, Ставропольский, Красноярский, Хабаровский края, Ямало-Ненецкий, Ханты-Мансийский, Чукотский, Усть-Ордынский Бурятский и Агинский Бурятский автономные округа.

Самыми пожароопасными территориями оказались Читинская область и Хабаровский край, на них пришлось 56% пройденной огнем территории.

К сожалению, официальная статистика практически не учитывает пожары вне территорий государственного лесного фонда. В частности, не учитываются огромные площади, пройденные огнем травяных пожаров.

Заключение

Статистика чрезвычайных ситуация показывает, что в России доля природных пожаров и вызываемых ими чрезвычайных ситуаций составляет приблизительно 24% от общего числа чрезвычайных ситуаций природного характера. Таким образом, проблема природных пожаров является одной из серьезных и требующих особого внимания. Для решения этой проблемы необходимо улучшить технику и оборудование МЧС для тушения пожаров на природных. В густонаселенных районах России нужно при планировании и ведении лесного хозяйства уходить от культур, особенно опасных в пожарном отношении. Должна быть создана эффективная национальная система спутникового мониторинга пожаров, обеспечивающая прямой прием спутниковой информации всеми как государственными, так и независимыми, в том числе – общественными принимающими станциями.

Применение классификации расстройств личности МКБ-11 | BMC Psychiatry

На базовом уровне классификация МКБ-11 дает клиницисту возможность быстрой оценки функционирования личности. Таким образом, практикующий врач должен быть в состоянии сначала определить наличие или отсутствие расстройства личности, затем его тяжесть и, при необходимости, один или несколько характерных признаков, которые способствуют выражению дисфункции личности. Соответственно, процедура классификации расстройства личности по МКБ-11 в значительной степени аналогична процедуре диагностики эпизода депрессии F32 по МКБ-10, которая имеет три уровня тяжести ( легкая , средняя и тяжелая ) и может , при необходимости, уточняются дополнительными кодами для отдельных функций.Например, F32.11 Умеренный депрессивный эпизод с соматическим синдромом или F32.3 Тяжелый депрессивный эпизод с психотическими симптомами.

Классификация тяжести расстройства личности заменяет сопутствующую патологию

Поскольку в классификации МКБ-11 больше не существует десяти различных типов категориальных диагнозов расстройства личности, у практикующего врача нет иного выбора, кроме как оценивать расстройство личности как таковое, а не сосредотачиваться на оценке на перекрывающихся и гетерогенные политетические категории (см. табл. 1 и 2) [4].Соответственно, вместо классификации по десяти типам, можно сказать, что МКБ-11 включает подклассификацию по трем категориям тяжести, которые не могут сосуществовать друг с другом (т. е. пациент не может иметь легкое расстройство личности, одновременно тяжелое расстройство личности). Таким образом, классификация МКБ-11 устраняет чрезмерную коморбидность, характерную для различных категорий расстройств личности по МКБ-10. Однако клиницист по-прежнему имеет возможность указать на наличие расстройства личности без указания степени его тяжести (т.д., «тяжесть не определена»). Установленный порог тяжести для постановки диагноза расстройства личности (по крайней мере, «легкая» степень тяжести) поясняется в таблице 3 и приводится в качестве примера в таблице 4. Таким образом, определение «легкая» степень тяжести может также использоваться в качестве критерия наличия или отсутствия Расстройство личности.

Возможность кодирования подпороговых расстройств личности

В дополнение к диагнозу «расстройство личности» (в главе «Психические и поведенческие расстройства») клиницисты могут указать наличие расстройств личности.Сложность личности не считается психическим расстройством как таковым, но доступна для клинического использования и находится в разделе классификации МКБ-11 для не связанных с болезнью сущностей, которые представляют собой факторы, влияющие на состояние здоровья и обращения за медицинской помощью. Трудности личности в чем-то сродни категории МКБ-10, не являющейся расстройством, Z73.1 «акцентуация личностных черт», которая является подкатегорией Z73 «Проблемы, связанные с трудностями управления жизнью» в главе «Факторы, влияющие на состояние здоровья и контакты с людьми». Медицинские услуги».

Как и диагноз расстройства личности, трудности личности характеризуются относительно стабильными трудностями (например, не менее 2 лет). Такие трудности связаны с некоторыми проблемами в функционировании, которые недостаточно серьезны, чтобы вызвать заметные нарушения в социальных, профессиональных и межличностных отношениях, и которые могут быть ограничены конкретными отношениями или ситуациями. Проблемы с эмоциями, познанием и поведением проявляются периодически (например, во время стресса) или с низкой интенсивностью.В отличие от легкого расстройства личности, у человека с трудностями личности возникают только некоторые непостоянные или слабо выраженные личностные проблемы (например, в ситуациях ограниченного риска), но не до такой степени, чтобы это ставило под угрозу способность человека сохранять работу, инициировать и действовать. поддерживать дружеские отношения и иметь несколько удовлетворительные интимные отношения.

Например, у пациента с расстройством пищевого поведения могут быть личностные трудности жесткого перфекционизма (т. е. ананкастия), но при этом он поддерживает крепкую социальную сеть и медленно, но неуклонно продвигается к завершению образования.У другого пациента с резистентными симптомами тревоги могут быть трудности с тревожностью (т. е. негативная аффективность), но в остальном он рассматривается как ценный друг и коллега. В обоих случаях указанные паттерны сложности личности выявляют определенные уязвимые места. В совокупности, когда это наиболее уместно, к пациенту с заслуживающими внимания, но не выдающимися проблемами личности можно применить код сложности личности.

Квалификаторы черт личности

Один или несколько квалификаторов стилистических черт могут быть закодированы, если они выделяются в характеристике личности человека с диагнозом Расстройство личности или Трудности личности.Тем не менее, важно признать, что квалификаторы черт не похожи на категории или синдромальные диагнозы, а вместо этого обозначают стилистические параметры, которые способствуют выражению личностной дисфункции. Однако в целях кодирования характерные квалификаторы признаков могут быть указаны только как присутствующие или отсутствующие, даже если они существуют в континууме. По существу, общая тяжесть личностной дисфункции (т. е. легкая , средняя и тяжелая ) отражает степень, в которой выраженные черты влияют на само- и межличностное функционирование пациента [29], что иллюстрируется на рисунке для каждого из пяти случаев.Таким образом, тяжелое расстройство личности, вероятно, связано с несколькими квалификаторами домена признака, тогда как легкое расстройство личности может быть связано с наличием только одного квалификатора признака. Другими словами, сложность квалификаторов области признаков часто может отражать тяжесть расстройства личности. Однако в некоторых случаях у человека может быть тяжелое расстройство личности и проявляться только один характерный признак (например, диссоциальность, представляющая серьезную опасность для других).

Квалификатор пограничного паттерна

Как показано в Таблице 6, классификация расстройств личности по МКБ-11 также включает возможность указания Квалификатора пограничного паттерна .Как и квалификаторы черты, квалификатор пограничного паттерна считается необязательным и может использоваться в сочетании с квалификаторами черты (например, Умеренное расстройство личности, с пограничным паттерном, с негативной аффективностью, расторможенностью и диссоциальностью ). В отличие от квалификаторов черт, квалификатор пограничного паттерна действует как требующий по крайней мере 5 из 9 политетических признаков, адаптированных из критериев DSM-5 для пограничного расстройства личности. Было высказано предположение, что этот определитель может служить знакомым индикатором для выбора психотерапевтического лечения в соответствии с установленной теорией и руководствами по лечению.

Начало и устойчивость расстройства личности

Как показано в таблице 1, расстройство личности должно сохраняться в течение длительного периода времени (> 2 лет). Элементы расстройства личности, как правило, впервые проявляются в детстве или подростковом возрасте и продолжают проявляться во взрослой жизни. Однако в то время как в МКБ-10 утверждается, что расстройства личности, как правило, стабильны с течением времени, в рекомендациях МКБ-11 прямо указывается, что расстройства личности «относительно» стабильны только после юношеского взросления и могут измениться так, что человек, у которого было расстройство личности в течение юношеская взрослость уже не имеет его к среднему возрасту.В некоторых случаях человек, у которого ранее не было диагностируемого расстройства личности, может развиться в более позднем возрасте. Иногда появление расстройства личности у пожилых людей может быть связано с потерей социальной поддержки, которая ранее помогала компенсировать расстройство личности.

Признаки психотизма и степень тяжести

В отличие от подходов DSM-5 Раздела II и Раздела III, классификация МКБ-11 не дает никакого кода для шизотипического расстройства личности или психотизма, поскольку такие признаки кодируются в рамках шизофрении и других первичные психотические расстройства.Однако, как показано в таблицах 3 и 4, классификация тяжести расстройства личности по МКБ-11 может быть основана на том, испытывает ли пациент «диссоциативные состояния или психотические убеждения или представления» и/или является ли он «крайне эксцентричным», что может напоминать некоторые черты шизотипического расстройства личности. Это согласуется с традиционным структурным подходом к классификации организации личности (например, высокий, средний и низкий пограничный уровни) [9, 10], при котором самый низкий и самый тяжелый уровень может включать преходящие психотические состояния.Другими словами, подход МКБ-11 классифицирует способность к тестированию реальности (т. е. точность ситуационных и межличностных оценок) в соответствии с уровнем тяжести расстройства личности, а не в качестве отдельного типа или области черт. Однако, как показано в Таблице 6, квалификатор пограничного паттерна также включает «преходящие диссоциативные симптомы или психотические черты (например, кратковременные галлюцинации, паранойя) в ситуациях сильного аффективного возбуждения», что согласуется с установленным DSM-IV. /5 конструкция пограничного расстройства личности .

Как поставить диагноз расстройства личности по МКБ-11?

Убедившись, что общие диагностические требования для расстройства личности соблюдены (таблица 1), пользователь может выбрать один из трех различных диагностических кодов в соответствии с тяжестью расстройства личности (таблица 3), а затем выбрать один или несколько известных кодов. квалификаторы признаков (табл. 5). Кроме того, квалификатор пограничного паттерна также может применяться, если клиническое описание соответствует этому паттерну (таблица 6).Как и в МКБ-10, соответствующая информация может быть получена из клинических интервью и наблюдений, анализа историй болезни и/или отчетов информаторов.

В настоящее время разрабатываются инструменты оценки, которые помогут клиницистам и исследователям в оценке диагноза расстройства личности в соответствии с МКБ-11. Между тем, диагностическая информация, полученная с помощью инструментов оценки, разработанных для модели AMPD DSM-5, может быть использована для постановки диагноза расстройства личности в соответствии с МКБ-11.Например, структурированное клиническое интервью для альтернативной модели расстройств личности DSM-5 (SCID-AMPD) операционализирует функционирование личности в соответствии со Шкалой функционирования уровня личности DSM-5 (LPFS) вместе с 25 аспектами черт DSM-5 [30]. ]. Оценка LPFS вместе с 25-гранным профилем личности может быть преобразована в диагноз расстройства личности по МКБ-11 с использованием «перекрестного перехода», как описано в таблице 7. Соответственно, модуль I SCID-AMPD оценивает три уровня нарушения расстройства личности ( два нижних уровня включают подпорог для диагностики и здорового функционирования, соответственно) [31], которые переводятся в классификацию ICD-11 легкого расстройства личности, умеренного расстройства личности и тяжелого расстройства личности, как показано в таблице 7.Аналогичным образом модуль II SCID-AMPD оценивает аспекты и домены признаков DSM-5 [30], которые могут быть напрямую переведены в квалификаторы доменов признаков МКБ-11 (см. Таблицу 7) или определены с помощью алгоритма для аспектов признаков, измеренных с помощью Опросник личности для DSM-5 (PID-5) Сноска 1 [32]. Наконец, квалификаторы домена признаков МКБ-11 также могут быть получены из доступной информации о категориальном расстройстве личности МКБ-10 с использованием «перехода», представленного в таблице 8 [22].

Таблица 7 МКБ-11 «Перекресток» для альтернативной модели расстройств личности DSM-5 Таблица 8 Предварительная МКБ-10 «Перекресток» для квалификаторов области признаков МКБ-11

Для клинического скрининга и исследовательских целей, самостоятельно были разработаны отчетные меры, чтобы определить тяжесть дисфункции личности и основные квалификаторы черт.Например, Шкала уровня функционирования личности – краткая форма 2.0 (LPFS-BF) [33, 34] эффективно измеряет нарушения само- и межличностного функционирования в соответствии с диагностическими рекомендациями МКБ-11. Опросник личности для МКБ-11 (PiCD) представляет собой инструмент самоотчета или отчета информатора из 60 пунктов, который описывает пять доменов МКБ-11 [19]. Наконец, как утверждалось ранее, домены МКБ-11 также могут быть разграничены с использованием эмпирически установленного алгоритма использования рейтингов в Личностном опроснике для DSM-5 (PID-5) для определения квалификаторов доменов признаков МКБ-11 [32].

python. Моя модель классификации символов предсказывает неправильно в каждом случае, и я не уверен, что это из-за моего кода или моих данных

Я создаю программу на Python для чтения телефонных номеров с изображений, и я хочу сделать это, прочитав каждый номер один за другим, а затем распечатав его в конце. Сейчас я пытаюсь просто заставить его работать только с одним персонажем. Вот обучающие данные, которые я использовал для числа 3, остальные очень похожи (обратите внимание, что я также включаю — и /, поскольку некоторые телефонные номера содержат эти символы).

Когда я пытаюсь ввести некоторые числа в модель для прогнозирования, точность в основном составляет 0%, и я не уверен, что я сделал что-то не так в своем коде или мои обучающие данные просто плохие? Примеры ввода:

И, наконец, вот мой код:

  импорт ОС
импорт cv2
импортировать numpy как np
импортировать тензорный поток как tf
импортировать matplotlib.pyplot как plt

ЗНАЧЕНИЯ = {
    «0»: «0»,
    «1»: «1»,
    «2»: «2»,
    «3»: «3»,
    «4»: «4»,
    «5»: «5»,
    «6»: «6»,
    «7»: «7»,
    «8»: «8»,
    '9': '9',
    '10': '-',
    '11': '/',
}


def нормализовать (изображение, метка):
    изображение = тф.приведение (изображение / 255., tf.float32)
    вернуть изображение, метка


train_new_model = Истина

если train_new_model:
    print("Загружается набор данных...")
    набор данных = tf.keras.utils.image_dataset_from_directory(
        'набор данных', image_size=(28, 28), color_mode='оттенки серого', label_mode='int', labels="inferred"
    )
    проверка = tf.keras.utils.image_dataset_from_directory(
        'проверка', image_size=(28, 28), color_mode='оттенки серого', label_mode='int', labels="inferred"
    )

    print("Нормализация данных...")
    набор данных = набор данных.карта (нормализация)

    модель = tf.keras.models.Sequential()
    model.add(tf.keras.layers.Flatten())
    model.add (tf.keras.layers.Dense (единицы = 128, активация = tf.nn.relu))
    model.add (tf.keras.layers.Dense (единицы = 128, активация = tf.nn.relu))
    model.add (tf.keras.layers.Dense (единицы = len (ЗНАЧЕНИЯ), активация = tf.nn.softmax))

    print("Компиляция модели...")
    model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

    print("Обучающая модель...")
    история = model.fit (набор данных, эпохи = 100, validation_data = проверка)

    печать (история.история.ключи())
    # обобщить историю для точности
    plt.plot(история.история['точность'])
    plt.plot(история.история['val_accuracy'])
    plt.title('точность модели')
    plt.ylabel('точность')
    plt.xlabel('эпоха')
    plt.legend(['поезд', 'тест'], loc='верхний левый')
    plt.show()
    # суммировать историю потерь
    plt.plot (история. история ['потеря'])
    plt.plot(история.история['val_loss'])
    пл.title('модель потеря')
    plt.ylabel('потеря')
    plt.xlabel('эпоха')
    plt.legend(['поезд', 'тест'], loc='верхний левый')
    plt.show()

    Вход()

    val_loss, val_acc = model.evaluate(набор данных)
    print("Потери: ", end="")
    печать (val_loss)
    print("Точность: ", end="")
    печать (val_acc)

    print("Сохранение модели...")
    model.save('цифры.модель')
еще:
    # Загружаем модель
    модель = tf.keras.models.load_model('digits.model')

номер_изображения = 1
в то время как os.path.isfile('digits/digit{}.png'.format(image_number)):
    пытаться:
        # Преобразование изображения в плоское черно-белое изображение и инвертирование их
        исходное изображение = cv2.imread('цифры/цифры{}.png'.format(image_number))
        серое изображение = cv2.cvtColor (исходное изображение, cv2.COLOR_BGR2GRAY)
        (thresh, blackAndWhiteImage) = cv2.threshold(grayImage, 127, 255, cv2.THRESH_BINARY)
        img = 255 - blackAndWhiteImage
        img = np.invert (np.array ([img]))

        # Прогнозировать и читать из решения VALUES
        прогноз = модель.predict (изображение)
        решение = np.argmax (прогноз)
        print("Предполагаемый символ:", end="")
        печать (ЗНАЧЕНИЯ [строка (решение)])

        # Показать изображение
        пл.imshow(img[0], cmap=plt.cm.binary)
        plt.show()

        input() # Ждем продолжения ввода
    кроме BaseException как ошибка:
        print('Произошло исключение: {}'.format(ошибка))
        print("Ошибка чтения изображения! Переходим к следующему изображению...")
    наконец:
        номер_изображения += 1

  

Вот график потерь модели:

Классификация и распознавание рукописных символов с использованием нейронной сети — IJERT

Классификация и распознавание рукописных символов с использованием нейронной сети

Sujithsree P S Профессор: C Venugopal

PG Студенческий заведующий кафедрой

Отдел электроники и связиОтдел электроники и связи

JCET, Палаккад, Индия JCET, Палаккад, Индия

Abstract Распознавание символов — это один из новых и развивающихся методов в области компьютерного зрения и искусственного интеллекта. Одной из способностей человека является распознавание, т. е. человека, персонажа, предмета и т. д. Символы из письменного документа могут быть легко распознаны людьми точно. Но та же задача сложна для машины. Разные языки имеют разные типы паттернов i.д., они отличаются друг от друга. Каждый символ в языке отличается своим узором, изгибом, формой и ориентацией. Так что распознать персонажа машиной сложно. Для этого мы должны научить эту систему распознавать персонажа. Для распознавания символов мы обрабатываем входное изображение, находим его признаки, закладываем схему классификации и обучаем систему с помощью нейронной сети распознавать символ. Для этого используется набор инструментов обработки изображений Mat lab и набор инструментов нейронной сети.Это помогает улучшить интерфейс между человеком и машиной во многих приложениях.

Термины индекса: Распознавание символов, искусственная нейронная сеть рукописных символов.

  1. ВВЕДЕНИЕ

    Обработка изображений — это манипулирование изображениями с помощью компьютера с точки зрения увлечения человека визуальными эффектами. С развитием технологий появилось несколько цифровых методов манипулирования изображениями. Обработка изображений используется в нескольких областях, таких как медицинские файлы, технологии печати, распознавание лиц, биометрическая обработка и т. д.В области искусственного интеллекта обработка изображений играет значительную роль. В настоящее время ведется несколько исследований по разработке самодумающих и самообучающихся машин. В этой области распознавание персонажей играет важную роль. Но выполнить такую ​​задачу на машине сложно. Для распознавания мы должны научить эту систему классифицировать и распознавать определенный символ. Распознавание символов включает в себя несколько этапов, таких как сбор данных, удаление шума, сегментация, извлечение признаков, классификация и распознавание.[1]

    Для обучения системы используется искусственная нейронная сеть. Нейронные сети аналогичны биологическим нейронным системам[2]. Это сильно взаимосвязанные нейронные системы с параллельными вычислениями. Для распознавания образов и классификации используются высокопараллельные распределенные нейронные сети. Эти системы искусственных нейронных сетей способны решать проблемы благодаря своей функции самообучения и самоорганизации. Он имеет сильно распределенную параллельную архитектуру с большими

    количество узлов и соединений.Один узел соединен с другим и связан с весом. Нейронные сети включают в себя такие задачи, как определение свойств узлов сети и динамики системы.

  2. ОБЪЕМ РАБОТ

    Распознавание символов — одно из направлений исследований в области искусственного интеллекта. Таким образом, он играет важную роль в развитии самодумающей машины. Доступно несколько схем распознавания символов, но каждая из них имеет определенные ограничения.Большинство схем распознавания распознают только символы фиксированного шрифта или только печатный текст. Машине трудно точно распознать написанный от руки документ. Классических методов распознавания образов как таковых недостаточно для распознавания визуальных символов из-за того, что у разных людей разный способ письма. Их образцы письма, стили письма и форма символов также различны[3]. Некоторые приложения, включая распознавание адресов в почтовом отделении, обработку банковских чеков, чтение документов, требуют систем распознавания рукописного ввода.Поэтому исследования идут в области распознавания символов для большей точности.

  3. ПРЕДЛАГАЕМАЯ СИСТЕМА

    Распознавание символов — это преобразование изображения рукописного или печатного текста в машинно-кодированный текст. Распознавание символов из отсканированных изображений документов было проблемой, которой уделялось большое внимание в области обработки изображений, распознавания образов и искусственного интеллекта. Как правило, изображения часто искажаются импульсным шумом в процедурах получения и передачи изображений.Шум может серьезно повлиять на распознавание символов. Следовательно, эффективная техника шумоподавления становится очень важной проблемой при обработке изображений. Для подавления импульсных шумов предложено множество методов шумоподавления изображения. В некоторых из них используется стандартный медианный фильтр или его модификации. Однако эти методы воздействуют как на зашумленные, так и на незашумленные пиксели. Чтобы избежать повреждения незашумленных пикселей, используется эффективный метод фильтрации. В противном случае это повлияет на дальнейшие операции обработки изображения.Предлагаемая система распознавания рукописных символов включает несколько операций, показанных на рис.1.

    в качестве сегментации и обнаружения границ. Поэтому для фильтрации шума используется стандартный медианный фильтр. После этого выполняется бинаризация изображения. Импульсный шум присутствует на изображении в виде черных и белых пятен. Медианный фильтр используется для фильтрации импульсного шума. Процесс бинаризации преобразует изображение в градациях серого в бинарное изображение. Бинарное изображение показано на рис.3. Здесь пиксели имеют только два значения 0 или 1, т.е.е. черные пиксели оцениваются как 0, а белые пиксели оцениваются как 1.

    Рис.1. Схематическая диаграмма системы распознавания символов C. Сегментация

    Рис. 3. Bi nayr V la use of Input I mga e

    1. Получение изображения

      Первым шагом в обработке изображения является получение изображения. Чтобы распознать символ с изображения, системе требуется отсканированное изображение в качестве входного изображения. Изображение должно иметь определенный формат, такой как .BMP, JPEG, JPG и т. д. Исходное изображение показано на рис.2.

      In Segmentation sub делит изображение на составляющие его области или объекты. Уровень подразделения зависит от решаемой проблемы. То есть сегментация должна прекратиться, когда будут обнаружены объекты или область интереса в приложении. Сегментация в основном представляет собой сегментацию на основе краев и сегментацию на основе областей. Для сегментации используются различные методы обнаружения, такие как обнаружение точек, обнаружение линий, обнаружение краев. Утонченное изображение с обнаруженными краями показано на рис.4.

    2. Предварительная обработка

    Рис.2. Входное изображение

    Предварительная обработка изображения состоит из нескольких шагов. Роль предварительной обработки заключается в отделении интересного узора от фона. Удаление шума, сглаживание и нормализация должны быть выполнены на этом этапе. Импульсный шум — это шум, который влияет на входное изображение во время его получения.[4] Импульсный шум ухудшает качество изображения и детализацию информации на изображении, а также влияет на дальнейшую обработку изображения, например

    Рис.4. Обнаружение утончения и краев

    1. Извлечение признаков

      На этом этапе извлекаются признаки символов, которые имеют решающее значение для их классификации на этапе распознавания. Это особая форма сокращения. Когда входной алгоритм очень большой, в то время он уменьшает данные. Если функции извлечены тщательно

      ожидается, что набор функций будет извлекать соответствующую информацию из входных данных, чтобы выполнить желаемую задачу, используя это уменьшенное представление вместо ввода полного размера.при извлечении признаков нахождение краев рукописных символов с помощью хитрого обнаружения краев.

    2. Классификация и признание

    Классификация и распознавание являются важным разделом в системе распознавания рукописных символов. Для него используются искусственные нейронные сети. Искусственные нейронные сети — это самообучающиеся и самоорганизующиеся сетевые системы, аналогичные системам биологических нейронных сетей. Эти высокопараллельные распределенные сетевые системы в основном используются для классификации и распознавания образов.[5] При распознавании образов нейросетевая система обучается идентифицировать из базы данных наиболее похожий образ, похожий на входное изображение. Нейросетевая система состоит из нескольких слоев нейронов, которые связаны между собой. Для активации нейронной системы входное изображение передается входному слою, и каждому входному узлу присваивается вес. Все узлы связаны друг с другом, поэтому входной узел активирует другие узлы. Это будет продолжаться до тех пор, пока не активируется выходной узел.После обучения нейронной сети система готова распознавать входные рукописные изображения. В предлагаемой системе несколько входных изображений обучаются и успешно распознают несколько рукописных символов в разных стилях. Выход предлагаемой системы представлен на рис.6 и рис.7.

    Рис.5. Искусственная нейронная сеть

    Рис.6. Ввод и вывод распознавания символов

    Рис.7. Ввод и вывод распознавания символов

  4. НЕОБХОДИМЫЕ ИНСТРУМЕНТЫ

    Для распознавания рукописных символов используются инструменты обработки изображений Matlab и нейросетевой ящик.Для предварительной обработки изображений и для классификации и распознавания символов используется набор инструментов нейронной сети.

  5. ЗАКЛЮЧЕНИЕ

Предлагаемая система успешно распознает разные слова, написанные от руки. Персонажи обучены искусственной нейронной сети, что дает точность 90%. Этот метод очень полезен в значительной степени для лучшего распознавания рукописных символов. Этот предлагаемый метод будет демонстрировать результаты снижения шума и улучшения качества изображения с различными уровнями шума, что сделает его пригодным для обработки изображений и сопоставления с образцом.

ПОДТВЕРЖДЕНИЕ

Я хотел бы поблагодарить моего руководителя проекта проф. С. Венугопала, заведующего кафедрой электроники и техники связи Джавахарлальского инженерно-технологического колледжа, Палаккад, за его непоколебимую поддержку и ценные предложения для успешного завершения проекта.

ССЫЛКИ

  1. Р.К. Гонсалес и Р.Э. Вудс, Цифровая обработка изображений Pearson Education, 2007.

  2. Reetika verma & Rupinder Kuar Эффективный метод распознавания символов с использованием нейронной сети и функции Surf Extraction, IJCSIT, vol.5, нет. 2, стр. 0975-9646, 1997.

  3. Альфонсо Баумгартнер, Распознавание символов на основе концентрации пикселей области для идентификации номерного знака. Информационные системы и компьютерные сети (ISCON 2012) Материалы, опубликованные в Международном журнале компьютерных приложений® (IJCA)

  4. П.-Я. Чен и С.-Ю. Лиен, Эффективный алгоритм сохранения границ для удаления шума из соли и перца, Письма об обработке сигналов IEEE, том. 15, стр. 833-836, дек.2008.

  5. Ниша Васудева, Хем Джйотсана Парашар и Сингх Виджендра Автономная система распознавания символов с использованием искусственного

    Neural NetworkInternational Journal of Machine Learning and Computing, Vol. 2, № 4, август 2012 г.

  6. Гаурав Кумар, Прадип Кумар Бхатия Подход к распознаванию текстовых изображений на основе нейронной сети

Международный журнал компьютерных приложений (0975 8887) Том 62 № 14, январь 2013 г.

Многоуровневый перцептронный подход к классификации символов

Многоуровневый персептронный подход для классификации символов

Европейский журнал молекулярной и клинической медицины , 2020, Том 7, Выпуск 9, Страницы 1283-1289

Аннотация
Многослойный персептрон (MLP) — это классификация искусственных нейронных сетей с прямой связью, в которых используются методы обработки человеческого мышления.Многослойный персептрон состоит из множества линейных слоев обученных сетевых ячеек, называемых персептроном вместе с пороговой функцией. В этой статье мы оцениваем вычислительные модели роя частиц и многослойного персептрона. Первый подход, алгоритм оптимизации роя частиц (PSO), касается основных компонентов модели искусственной нейронной сети для распознавания рукописных символов. Рукописные штрихи символов собираются в виде векторов признаков, и на основе этих векторов происходит классификация символов.Второй подход, метод ограничивающего прямоугольника, используется нейронной сетью MLP (Multi-Layer Perceptron). Результаты сравниваются и оцениваются их производительность и стабильность при распознавании рукописного текста.

(2020). Многоуровневый персептронный подход к классификации символов. Европейский журнал молекулярной и клинической медицины , 7(9), 1283-1289.

Анита Венугопал, Мукеш Маданан, Ахил Венугопал. «Подход многослойного персептрона к классификации символов». Европейский журнал молекулярной и клинической медицины , 7, 9, 2020, 1283-1289.

(2020). «Многослойный перцептронный подход к классификации символов», Европейский журнал молекулярной и клинической медицины , 7 (9), стр. 1283-1289.

Многослойный персептронный подход к классификации символов. Европейский журнал молекулярной и клинической медицины , 2020; 7(9): 1283-1289.

  • Просмотр статьи: 107
  • Скачать PDF: 170

4 простых шага по созданию OCR. Оптическое распознавание символов (OCR) — это… | Нага Киран

Оптическое распознавание символов (OCR) — это процесс классификации оптических образов, содержащихся в цифровом изображении.Распознавание символов достигается за счет сегментации, выделения признаков и классификации.

OCR (оптическое распознавание символов) — это распознавание печатных или письменных текстовых символов компьютером. Это включает в себя фотосканирование текста посимвольно, анализ отсканированного изображения, а затем преобразование изображения символа в коды символов, такие как ASCII, обычно используемые при обработке данных.

При обработке OCR отсканированное изображение или растровое изображение анализируется на наличие светлых и темных областей, чтобы идентифицировать каждую букву алфавита или цифру.Когда символ распознан, он преобразуется в код ASCII. Для ускорения процесса распознавания используются специальные печатные платы и компьютерные микросхемы, разработанные специально для оптического распознавания текста.

Этапы оптического распознавания символов: —

Этапы оптического распознавания символов: —

1) Извлечение границ символов из изображения,

2) Построение сверточной нейронной сети (ConvNet) для запоминания изображений символов,

3) Загрузка обученной модели сверточной нейронной сети (ConvNet),

4) Консолидация прогнозов символов ConvNet

Алгоритм построен таким образом, чтобы сегментировать каждый отдельный символ в изображении как отдельные изображения 🙂 с последующим распознаванием и объединение в текст на изображении.

1) Оптическое сканирование ✂️ с изображения:

  • Выберите любой документ или письмо с текстовой информацией по границе). Контуры — полезный инструмент для анализа формы, обнаружения и распознавания объектов. Здесь Contours объяснили, как различать каждый отдельный символ на изображении с использованием техники расширения контура.Создайте границу для каждого символа на изображении с помощью метода OpenCV Contours. Распознавание символов с использованием метода контуров OpenCV.
  • Реализация кода OpenCV для дифференциации слов с использованием контуров
    расширенный = cv2.dilate (thresh2, ядро, итерации = 2)
    _, контуры, иерархия = cv2.findContours (расширенный, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    координаты = []
    для центов в контурах :
    х, у, ш, ч = cv2.boundingRect(cnt)
    cordinates.append((x,y,w,h))
    #bound the images
    cv2.rectangle(im,(x,y),(x+w,y+h),( 0,255,0),1)

    cv2.namedWindow(‘BindingBox’, cv2.WINDOW_NORMAL)
    cv2.imwrite(‘data/BindingBox4.jpg’,im)

    Соблюдено соглашение об именах (маркировка): извлеченные текстовые символы должны быть помечены связанным с ними исходным именем символа.

    Соблюдается соглашение об именах: последняя буква имени файла должна быть именем, связанным с символом для предварительной обработки данных изображения.

    1. Необработанные данные в зависимости от типа сбора данных подвергаются ряду предварительных этапов обработки, чтобы их можно было использовать на описательных этапах анализа характера. Изображение, полученное в результате сканирования, может содержать определенное количество шума
    2. Сглаживание подразумевает как заполнение, так и прореживание. Заполнение устраняет небольшие разрывы, пробелы и дыры в оцифрованных символах, а утончение уменьшает ширину строки.
     (a) уменьшение шума 

    (b) нормализация данных и

    (c) сжатие объема сохраняемой информации.

    2) Построить модель ConvNet ✂️ (Модель распознавания символов):

    Сверточная сеть из 8 слоев с остаточными обратными связями 2*4 слоев, используемыми для запоминания шаблонов ✂️ изображений отдельных символов.

    • 1-я модель будет обучаться на изображениях отдельных персонажей с прямой классификацией, чтобы прогнозировать изображения с классификацией категорий символов softmax.
    • 2-я модель — это та же модель с последним перед слоем в качестве предиктора, который будет вычислять встраивание указанных нейронов сглаживания (прогнозируемые значения сглаживания будут иметь информацию о функциях изображений получения).

    3) Загрузка обученной модели ConvNet OCR:

    Последний шаг оптического распознавания символов включает предварительную обработку изображения в определенные контуры, связанные со словами и буквами, с последующим прогнозированием и объединением в соответствии с контурами, связанными с буквами и словами в изображении.

    один раз после обучения модели мы можем сохранить и загрузить предварительно обученную модель оптического распознавания символов.

    4) Проверка и консолидация прогнозов OCR:

    Консолидация прогнозов включает присвоение определенного идентификатора каждому контуру, связанному со словом, с линией, связанной со словом на изображении, объединение всех прогнозов в отсортированную серию контуров, связанных со словом, и буквы связанные слова.

    Улучшенная классификация символов арабского алфавита с использованием сверточных нейронных сетей (CNN)

    Распознавание рукописных символов является сложной темой исследования. Было представлено много работ по распознаванию букв разных языков. Доступность баз данных арабских рукописных символов ограничена. Руководствуясь этой темой исследования, мы предлагаем свёрточную нейронную сеть для классификации арабских рукописных букв. Кроме того, выполняются семь алгоритмов оптимизации, и сообщается о лучшем алгоритме.Столкнувшись с небольшим количеством доступных наборов данных, написанных от руки на арабском языке, были реализованы различные методы увеличения данных, чтобы повысить надежность, необходимую для модели сверточной нейронной сети. Предлагаемая модель улучшена за счет использования метода регуляризации отсева, чтобы избежать проблем переобучения данных. Кроме того, представлены подходящие изменения в выборе алгоритмов оптимизации и подходов к увеличению данных для достижения хорошей производительности. Модель была обучена на двух наборах данных арабских рукописных символов AHCD и Hijja.Предложенный алгоритм достиг высокой точности распознавания 98,48% и 91,24% на AHCD и Hijja соответственно, превосходя другие современные модели.

    1. Введение

    Приблизительно четверть миллиарда человек во всем мире говорят и пишут на арабском языке [1]. Существует множество исторических книг и документов, представляющих собой важнейший набор данных для большинства арабских стран, написанных на арабском языке [1, 2].

    В последнее время повышенное внимание исследователей уделяется области распознавания арабских рукописных символов (AHCR) [3–5].Это сложная тема компьютерного зрения и распознавания образов [1]. Это связано со следующим: (i) Различием между образцами почерка [3]. (ii) Сходством формы между арабскими алфавитами [1, 3]. (iii) Диакритическими знаками арабских символов [6]. (iv) Как 1, в арабском языке форма каждого рукописного символа зависит от его положения в мире. Например, здесь в слове «أمراء» иероглиф «Алиф» написан в двух разных формах «أ» и «ا», где в арабском языке каждый иероглиф имеет от двух до четырех форм.В таблице 1 показаны различные формы двадцати восьми арабских алфавитов.


    9038 4 ن

    Номер Наименование Изолированные Начиная Средний Конец

    1 Алиф ا ا إ أ
    2 Баа ب ب ب ب
    3 Чай ت ت ت ت
    4 Теа ث ث ث ث
    5 Застревание ج ج ج ج
    6 Хаа ح ح ـحـ ـح
    7 Khaa خ خـ 903ـ 9 384 خ
    8 Даал د د د د
    9 Thaal ذ ذ ذ ذ
    10 Раа ر ر ر ر
    11 Zaay ز ز ز ز
    12 замечен س س س س
    13 Шин ش ش ش ش
    14 Sad ص ص ص ص
    15 Dhad ض ض ض ض ض ض
    16 TAH ط ط ط ط ط
    17 Д ظ ظ ظ ظ
    18 Ain ع ع ع ع
    19 Ghen غ غ غ غ
    20 Fa ف ف ف ف
    21 Каф ق ق ق ق
    22 Каф ك ك ك ك
    23 Lam ل ل ل ل
    24 Мим م م م م م م
    25 Noon ن ن ن
    26 Ха ه ه ه ه
    27 Waw و و و و
    28 Yaa ي ي ي ي ي ي ي ي

    с разработкой глубокого обучения (DL), свертки нейровых сетей (CNNS) показали существенные возможности для распознавания рукописных персонажей разные языки [3, 7, 8]: латынь [9, 10], китайский [11], деванагари [12], малаялам [11] и др.

    Большинство исследователей улучшили архитектуру CNN, чтобы добиться хорошей производительности распознавания рукописных символов [6, 13]. Однако нейронная сеть с отличной производительностью обычно требует хорошей настройки гиперпараметров CNN и хорошего выбора применяемых алгоритмов оптимизации [14–16]. Кроме того, для достижения выдающихся результатов требуется большой объем обучающего набора данных [17, 18].

    Основные результаты этого исследования можно резюмировать следующим образом: (i) Предложение модели CNN для распознавания арабских рукописных символов.(ii) Настройка различных гиперпараметров для повышения производительности модели. (iii) Применение различных алгоритмов оптимизации. Отчет об эффективности лучших из них. (iv) Представление различных методов увеличения данных. Отчет о влиянии каждого метода на улучшение распознавания арабских рукописных символов. (v) Смешивание двух разных наборов данных арабских рукописных символов для изменения формы. Проверка влияния представленных подходов к дополнению данных на смешанный набор данных.

    Остальная часть этого документа организована следующим образом.В разделе 2 мы представляем соответствующие работы по классификации арабских рукописных символов. В разделах 3 и 4 мы описываем архитектуру сверточной нейронной сети и гиперпараметры настройки модели. В разделе 5 мы делаем подробное описание различных используемых алгоритмов оптимизации. В разделе 6 мы описываем различные используемые методы увеличения данных, выбранные в этом исследовании. В разделе 7 мы приводим обзор экспериментальных результатов, демонстрирующих выдающуюся производительность CNN. Раздел 8 представляет собой заключение и возможные направления будущих исследований.

    2. Родственные работы

    В последние годы многие исследования были посвящены классификации и распознаванию букв, в том числе арабских рукописных символов. С другой стороны, существует меньшее количество предлагаемых подходов для распознавания отдельных символов в арабском языке. В результате распознавание арабских рукописных символов менее распространено по сравнению с английским, французским, китайским, деванагари, хангыль, малаялам и т. д.

    Впечатляющие результаты были достигнуты в классификации рукописных символов разных языков с использованием моделей глубокого обучения и, в частности, CNN.

    Эль-Сави и др. [6] собрали собственный набор данных арабских рукописных символов (AHCD) от 60 участников. AHCD состоит из 16 800 символов. Они достигли точности классификации 88%, используя модель CNN, состоящую из 2 сверточных слоев. Для повышения производительности CNN в модель были реализованы регуляризация и различные методы оптимизации. Точность тестирования повысилась до 94,93%.

    Altwaijry и Turaiki [13] представили новый набор данных арабских рукописных букв (названный «Hijja»).Он состоял из 47 434 символов, написанных 591 участником. Предложенная ими модель CNN смогла достичь точности тестирования 88% и 97% с использованием наборов данных Hijja и AHCD соответственно.

    Юнис [19] разработал модель CNN для распознавания арабских рукописных символов. CNN состояла из трех сверточных слоев, за которыми следовал один последний полносвязный слой. Модель достигла точности 94,7% для базы данных AHCD и 94,8% для AIA9K (набор данных арабского алфавита).

    Латиф и др.[20] разработали CNN для распознавания сочетания почерка нескольких языков: персидского, деванагари, восточно-арабского, урду и западно-арабского. Входное изображение имеет размер (28 × 28) пикселей, за ним следуют два сверточных слоя, а затем к обоим сверточным слоям применяется операция максимального объединения. Общая точность комбинированной многоязычной базы данных составила 99,26%. Средняя точность составляет около 99% для каждого отдельного языка.

    Альробах и Альбахл [21] проанализировали набор данных Hijja и обнаружили нарушения, такие как некоторые искаженные буквы, размытые символы и некоторые размытые символы.Они использовали модель CNN для извлечения важных функций и модель SVM для классификации данных. Они достигли точности тестирования 96,3%.

    Мудхш и др. [22] разработали сетевую архитектуру VGG для распознавания арабских рукописных символов и цифр. Модель состоит из 13 сверточных слоев, 2 слоев максимального объединения и 3 полносвязных слоев. Методы увеличения и исключения данных использовались, чтобы избежать проблемы переобучения. Модель была обучена и оценена с использованием двух разных наборов данных: ADBase для темы классификации арабских рукописных цифр и HACDB для задачи классификации арабских рукописных символов.Модель достигла точности 99,66% и 97,32% для ADBase и HACDB соответственно.

    Буфенар и др. [23] использовали популярную архитектуру CNN Alexnet. Он состоит из 5 сверточных слоев, 3 слоев максимального объединения и 3 полносвязных слоев. Эксперименты проводились на двух разных базах данных, OIHACDB-40 и AHCD. На основе хорошей настройки гиперпараметров CNN и с использованием методов отсева и мини-пакетов была достигнута точность CNN 100% и 99,98% для OIHACDB-40 и AHCD.

    Мустафа и др. [24] предложили условную глубокую сверточную генеративную состязательную сеть (CDCGAN) для управляемой генерации изолированных рукописных арабских символов. CDCGAN был обучен на наборе данных AHCD. Они достигли 10-процентного разрыва в производительности между реальными и сгенерированными рукописными арабскими символами.

    В таблице 2 приведены обзоры литературы по распознаванию арабских рукописных символов с использованием моделей CNN. Из предыдущей литературы мы заметили, что большинство архитектур CNN были обучены с использованием арабских букв для взрослых «AHCD».Кроме того, мы наблюдаем, что большинство исследователей пытаются улучшить производительность за счет хорошей настройки гиперпараметров модели CNN.

    — 99.98

    Ссылки Год Dataset Тип (размер) Метод Оптимизация Точность (%) Потери (%)

    Эль-Сави и др. [6].93 5.1

    Mudhsh et al. [22] 2017 INDBASE цифры (6.600) CNN (на основе VGG Net) (II) Dropout 99,6
    HACDB Chars (70 000) iii) Увеличение данных 97,32

    Boufenar et al. [23] 2017 OIHACDB Символы (6.600) CNN (на основе Alexnet) (I) Dropout 100
    AHCD (II) Minibatch 99,98

    Younis [19] +2018 AHCD Символов (8.737) CNN — 97,7 —
    AIA9K 94,8

    Латиф и др.[20] 2018 Микс почерка нескольких языков CHARS CNN 99,26 0,02

    Altwaijry и Turaiki [13] 2020 Хиджа Символов (47434) CNN 88
    AHCD 97

    Alrobah & Albahl [21] 2021 Хиджа Символы (47 434) CNN + SVM 96.3

    Mustapha et al. [24] 2021 AHCD CDCGAN

    3. Предложенные арабские рукописные персонажи системы признания

    , как показано на рисунке 2, модель, которую мы предложили в этом исследовании, состоит из трех основных компонентов: предложенной CNN архитектуры, алгоритмов оптимизации и методов увеличения данных.


    В этой статье предложенная модель CNN содержит четыре слоя свертки, две операции максимального объединения и модель ANN с тремя полностью скрытыми слоями, используемыми для классификации. Чтобы избежать проблем переобучения и улучшить производительность модели, использовались различные методы оптимизации, такие как отсев, минипатч, выбор функции активации и т. д.

    На рисунке 3 показана предложенная модель CNN. Кроме того, в этой работе производительность распознавания арабских рукописных букв была улучшена за счет правильного выбора алгоритма оптимизации и использования различных методов увеличения данных, таких как геометрические преобразования, увеличение пространства признаков, введение шума и смешивание изображений.


    4. Архитектура сверточной нейронной сети

    Модель CNN [25–34] представляет собой ряд слоев свертки, за которыми следуют полностью связанные слои. Слои свертки позволяют извлекать важные функции из входных данных. Полносвязные слои используются для классификации данных. Вход CNN — это изображение, которое нужно классифицировать; вывод соответствует предсказанному классу арабского рукописного символа.

    4.1. Входные данные

    Входные данные представляют собой изображение размером .Определяет ширину и высоту изображения и обозначает пространство или количество каналов. Значение равно 1 для изображения в градациях серого и равно 3 для цветного изображения RGB.

    4.2. Уровень свертки

    Уровень свертки состоит из операции свертки, за которой следует операция объединения.

    4.2.1. Операция свертки

    Основная концепция классической операции свертки между входным изображением размера и фильтром размера определяется следующим образом (см. рис. 4):


    Здесь ⊗ обозначает операцию свертки. C — карта свертки размера ( a  ×  a ), где . является шагом и обозначает количество пикселей, на которое более . прокладка; часто необходимо добавить ограничение нулями, чтобы сохранить полную информацию об изображении. Рисунок 4 представляет собой пример операции свертки между входным изображением размера (8 × 8) и фильтром размера (3 × 3). Здесь карта свертки имеет размер (6 × 6) с шагом и отступом.

    Как правило, к карте свертки C применяется нелинейная функция активации.Обычно используемыми функциями активации являются сигмовидная [34–36], гиперболический тангенс «Tanh» [35, 37] и выпрямленная линейная единица «ReLU» [37, 38], где здесь — карта свертки после применения нелинейной функции активации f . На рис. 5 показана карта, когда функция активации ReLU применяется к .


    4.2.2. Операция объединения в пул

    Операция объединения в пул используется для уменьшения размерности, что снижает вычислительную сложность сети. Во время операции объединения ядро ​​размера скользит поверх .обозначает количество патчей, с помощью которых более . В нашем анализе s p установлено на 2. Операция объединения выражается как где карта объединения и операция объединения. Наиболее часто используемыми операциями пулинга являются средний пул, максимальный пул и минимальный пул. На рис. 6 показана концепция операций объединения средних и максимальных значений с использованием ядра размера и шага 2.


    4.3. Операция конкатенации

    Операция конкатенации отображает набор свернутых изображений в вектор, называемый вектором конкатенации.здесь — результат свертки. обозначает количество фильтров, примененных к свернутым изображениям.

    4.4. Fully Connected Layer

    Операция классификации CNN выполняется через полносвязный слой [39]. Его входом является вектор конкатенации; предсказанный класс является выходом классификатора CNN. Операция классификации выполняется через серию из t полностью связанных скрытых слоев. Каждый полносвязный скрытый слой представляет собой параллельный набор искусственных нейронов.Подобно синапсам в биологическом мозге, искусственные нейроны соединяются с помощью весов. Выход модели полностью связанного скрытого слоя — это вектор суммы весов, представляющий собой нелинейную функцию активации (сигмоид, Tanh, ReLU и т. д.). Значение смещения определяет уровень активации искусственных нейронов.

    5. Процесс обучения CNN

    Обученная CNN — это система, способная определять точный класс заданных входных данных. Обучение достигается за счет обновления параметров слоя (фильтров, весов и смещений) на основе ошибки между предсказанным классом CNN и меткой класса.Процесс обучения CNN представляет собой итеративный процесс, основанный на операциях прямого распространения и обратного распространения.

    5.1. Распространение с прямой связью

    Для модели CNN уравнения прямой связи могут быть получены из (1)–(5) и (6). Функция активации Softmax [40, 41] применяется на последнем слое для генерации предсказанного значения класса входного изображения. Для мультиклассовой модели Softmax выражается следующим образом: где обозначает количество классов, является координатой выходного вектора и выходом искусственного нейрона.

    5.2. Backpropagation

    Для обновления параметров CNN и выполнения процесса обучения разработан алгоритм оптимизации обратного распространения для минимизации выбранной функции стоимости. В этом анализе используется функция стоимости перекрестной энтропии (CE) [40]. Здесь — желаемый результат (метка данных).

    Наиболее часто используемый алгоритм оптимизации для решения задач классификации — градиентный спуск (GD). Различные оптимизаторы для алгоритма GD, такие как импульс, AdaGrad, RMSprop, Adam, AdaMax и Nadam, использовались для повышения производительности CNN.

    5.2.1. Градиентный спуск [40, 42]

    GD — простейшая форма оптимизационных алгоритмов градиентного спуска. Он прост в реализации и обеспечивает значительную точность классификации. Общее уравнение обновления параметров CNN с использованием алгоритма GD представляет собой обновление фильтров, весов и смещений. — градиент по отношению к параметру — скорость обучения модели. Слишком большое значение может привести к расхождению алгоритма GD и вызвать колебания производительности модели.Слишком маленький останавливает процесс обучения.

    5.2.2. Градиентный спуск с импульсом [43]

    Гиперпараметр импульса определяет скорость, на которую должна увеличиваться скорость обучения, когда модель приближается к минимуму функции стоимости. Уравнения обновления с использованием алгоритма GD импульса выражаются следующим образом: где момент, полученный при итерации.

    5.2.3. AdaGrad [44]

    В этом алгоритме скорость обучения является функцией градиента.Он определяется следующим образом:гдегде — небольшое значение сглаживания, используемое, чтобы избежать деления на 0, и представляет собой сумму квадратов градиентов.

    При небольшой величине значение увеличивается. Если очень велико, значение является константой. Алгоритм оптимизации AdaGrad изменяет скорость обучения для каждого параметра в заданное время с учетом предыдущего обновления градиента. Уравнение обновления параметров с помощью AdaGrad выражается следующим образом:

    5.2.4. AdaDelta [45]

    Проблема с AdaGrad заключается в том, что при большом количестве итераций скорость обучения становится очень низкой, что приводит к медленной сходимости.Чтобы решить эту проблему, алгоритм AdaDelta предложил взять в качестве решения экспоненциально затухающее среднее значение, где где — затухающее среднее значение по квадратам прошлых градиентов, которое обычно составляет около 0,9.

    5.2.5. RMSprop [45, 46]

    На самом деле RMSprop идентичен исходному вектору обновления AdaDelta, который мы получили выше:

    5.2.6. ADAM [17, 45, 46]

    Этот алгоритм оптимизатора градиентного спуска вычисляет скорость обучения на основе двух векторов: где и — векторы моментов и порядка.и – скорости распада. и представляют среднее значение и дисперсию предыдущего градиента.

    Когда и очень малы, для обновления параметров требуется большой размер шага. Чтобы избежать этой проблемы, к и .where is power и is power добавляется значение коррекции смещения.

    Уравнение обновления Адама выражается следующим образом:

    5.2.7. AdaMax [45, 47]

    Коэффициент в алгоритме Адама регулирует градиент обратно пропорционально норме предыдущих градиентов (через ) и текущего градиента t :

    Обобщение этого обновления до нормы выглядит следующим образом:

    Чтобы избежать численной нестабильности, на практике наиболее распространены нормы ℓ1 и ℓ2.Однако в целом ℓ∞ также демонстрирует стабильное поведение. В результате авторы предлагают AdaMax и демонстрируют, что с ℓ∞ сходится к более стабильному значению. Здесь

    5.2.8. Nadam [43]

    Это комбинация Adam и NAG, где уравнение обновления параметров с использованием NAG определяется следующим образом:

    Уравнение обновления с использованием Nadam выражается следующим образом:

    6. Методы увеличения данных

    Глубокая свертка нейронные сети в значительной степени зависят от больших данных, чтобы добиться отличной производительности и избежать проблемы переобучения.

    Чтобы решить проблему нехватки данных для арабских рукописных символов, мы представляем некоторые базовые методы увеличения данных, которые увеличивают размер и качество обучающих наборов данных.

    Подходы к увеличению изображения, используемые в этом исследовании, включают геометрические преобразования, увеличение пространства признаков, введение шума и смешивание изображений.

    Увеличение данных на основе геометрических преобразований и увеличение пространства признаков [17, 48] часто связано с применением вращения, отражения, смещения и масштабирования.

    6.1. Вращение

    Входные данные поворачиваются вправо или влево по оси в диапазоне от 1° до 359°. Параметр степени вращения оказывает значительное влияние на безопасность набора данных. Например, в задачах идентификации цифр, таких как MNIST, могут быть полезны небольшие повороты, например, от 1 до 20 или от -1 до -20, но когда степень вращения увеличивается, сеть CNN не может точно различать некоторые цифры.

    6.2. Переворот

    Входное изображение переворачивается по горизонтали или вертикали.Это дополнение является одним из самых простых в реализации и оказалось полезным для некоторых наборов данных, таких как ImageNet и CIFAR-10.

    6.3. Сдвиг

    Входное изображение смещается вправо, влево, вверх или вниз. Это преобразование является очень эффективной корректировкой для предотвращения позиционного смещения. На рис. 7 показан пример метода увеличения данных со сдвигом с использованием символов арабского алфавита.


    6.4. Масштабирование

    Входное изображение масштабируется либо путем добавления нескольких пикселей вокруг изображения, либо путем применения случайного масштабирования к изображению.Величина масштабирования влияет на качество изображения; например, если мы применяем большое масштабирование, мы можем потерять некоторые пиксели изображения.

    6.5. Noise Injection

    Как видно на арабских рукописных иероглифах, на изображениях присутствуют естественные шумы. Шумы затрудняют распознавание, и по этой причине шумы уменьшаются с помощью методов предварительной обработки изображения. Причина шумоподавления заключается в выполнении высокой классификации, но это приводит к изменению формы символа.Основные наборы данных в этой теме исследования рассматриваются с изображениями с шумоподавлением. Вопрос, на который мы здесь отвечаем, заключается в том, как метод может быть устойчивым к любому шуму.

    Добавление шума [48, 49] к сверточной нейронной сети во время обучения помогает модели изучить более надежные функции, что приводит к повышению производительности и ускорению обучения. Мы можем добавить несколько типов шума при распознавании изображений, например следующие. (i) Гауссов шум: введение матрицы случайных значений, полученных из гауссовского распределения (ii) Шум соли и перца: случайное изменение определенного количества пикселей до полностью белого или полностью черного (iii) Спекл-шум: добавление только черных пикселей «перца» или белых пикселей «соли»

    Добавление шума к входным данным является наиболее часто используемым подходом, но во время обучения мы можем добавить случайный шум к другим частям модели CNN.Некоторые примеры включают следующее: (i) Добавление шума к выходным данным каждого слоя (ii) Добавление шума к градиентам для обновления параметров модели (iii) Добавление шума к целевым переменным

    6.6. Смешивание баз данных изображений

    В этом исследовании мы расширяем обучающий набор данных, смешивая два разных набора данных арабских рукописных символов, AHCD и Hijja, соответственно. AHCD — чистая база данных, а Hijja — набор данных с изображениями очень низкого разрешения. Он содержит множество искаженных изображений алфавитов.

    Затем мы оцениваем влияние различных упомянутых методов увеличения данных (геометрические преобразования, увеличение пространства признаков и введение шума) на эффективность распознавания нового набора данных микширования.

    7. Экспериментальные результаты и обсуждение
    7.1. Наборы данных

    В этом исследовании использовались два набора данных арабских рукописных символов: набор данных арабских рукописных символов «AHCD» и набор данных хиджа.

    AHCD [6] содержит 16 800 рукописных символов размером (32 × 32 × 1) пикселей.Его написали 60 участников в возрасте от 19 до 40 лет, и большинство участников — правши. Каждый участник написал арабский алфавит от «алеф» до «йе» 10 раз. Набор данных имеет 28 классов. Он разделен на обучающий набор из 13 440 символов и тестовый набор из 3 360 символов. Набор данных

    Hijja [13] состоит из 4,434 арабских символов размером (32 × 32 × 1) пикселей. Его написал 591 школьник в возрасте от 7 до 12 лет. Сбор данных от детей — очень сложная задача.Для детского почерка характерны деформированные знаки; поэтому набор данных содержит повторяющиеся буквы, пропущенные буквы и множество искаженных или нечетких символов. Набор данных имеет 29 классов. Он разделен на обучающий набор из 37 933 символов и тестовый набор из 9 501 символа (80% для обучения и 20% для теста).

    На рис. 8 показан пример наборов данных рукописных букв арабского языка AHCD и хиджа.

    7.2. Экспериментальная среда и оценка производительности

    В этом исследовании реализация и оценка модели CNN выполняются в среде глубокого обучения Keras с бэкэндом TensorFlow в Google Colab с использованием ускорителя графического процессора.

    Мы оцениваем производительность предложенной нами модели с помощью следующих показателей:   Точность ( A ) — это мера того, сколько правильных прогнозов ваша модель сделала для полного набора тестовых данных:   Полнота ( R ) — это доля изображений, которые правильно классифицированы по общему количеству изображений, принадлежащих к классу:   Точность ( P ) – это доля изображений, которые правильно классифицированы, по отношению к общему количеству классифицированных изображений:   F 1 показатель представляет собой комбинацию показателей полноты и точности :

    Здесь TP = истинно положительный (это общее количество изображений, которые можно правильно пометить как принадлежащие к классу x), FP = ложноположительный (представляет общее количество изображений, которые были неправильно помечены как принадлежащие к классу x), FN = ложноотрицательный (представляет общее количество изображений, которые были неправильно помечены как не принадлежащие к классу x), TN  = истинно отрицательный (представляет общее количество изображений, at были правильно помечены как не принадлежащие к классу x).

    Также рисуем площадь под ROC-кривой (AUC), где имеем следующее.

    Кривая ROC (кривая рабочих характеристик приемника) представляет собой график, показывающий эффективность всех порогов классификации. На этой кривой показаны два параметра: (i) Частота истинно положительных результатов (ii) Частота ложноположительных результатов

    AUC означает «площадь под ROC-кривой». То есть AUC измеряет всю двумерную область под всей ROC-кривой от (0,0) до (1,1).

    7.3. Настройка гиперпараметров CNN

    Цель состоит в том, чтобы выбрать лучшую модель, которая хорошо соответствует наборам данных AHCD и Hijja.Было проведено множество проб и ошибок в механизме настройки конфигурации сети.

    Наилучшая производительность была достигнута, когда модель CNN была построена из четырех слоев свертки, за которыми следуют три полностью связанных скрытых слоя. Модель начинается с двух слоев свертки с 16 фильтрами размера (3 × 3), затем оставшиеся 2 слоя свертки имеют 32 фильтра размера (3 × 3), и за каждыми двумя слоями свертки следуют слои максимального объединения с ( 2 × 2) размерность ядра. Наконец, три полностью связанных слоя (плотные слои) с функцией активации Softmax для выполнения прогнозирования.ELU, нелинейная функция активации, использовалась для удаления отрицательных значений путем преобразования их в 0,001. Значения весов и смещения обновляются в процессе обратного распространения, чтобы минимизировать функцию потерь.

    Чтобы уменьшить проблему переобучения, в модель между плотными слоями добавляется коэффициент отсева 0,6, который применяется к выходным данным предыдущего слоя, которые подаются на последующий слой. Оптимизированные параметры, используемые для повышения производительности CNN, были следующими: алгоритм оптимизатора — Адам, функция потерь — кросс-энтропия, скорость обучения   =  0.001, размер партии = 16 и эпохи = 40.

    Мы сравниваем нашу модель с CNN-for-AHCD как по набору данных Hijja, так и по набору данных AHCD. Код для CNN-for-AHCD доступен онлайн [31], что позволяет сравнивать его производительность с различными наборами данных.

    В наборе данных Hijja, который имеет 29 классов, наша модель достигла средней общей точности тестового набора 88,46 %, точности 87,98 %, отзыва 88,46 % и оценки F1 88,47 %, в то время как CNN-for-AHCD достиг средняя общая точность тестового набора 80%, точность 80.79%, отзыв 80,47% и оценка F1 80,4%.

    В наборе данных AHCD, который имеет 28 классов, наша модель достигла средней общей точности тестового набора 96,66 %, точности 96,75 %, отзыва 96,67 % и оценки F1 96,67 %, в то время как CNN для-AHCD достиг средняя общая точность тестового набора 93,84%, точность 93,99%, полнота 93,84% и оценка F1 93,84%.

    подробные метрики сообщаются на персонаж в таблице 3.

    F1 2. Baa 4. Теа 6. Хаа 0,77 8. Даал 0,68 10. Раа 0,89 12. замечен 0,82 14. Грустный 0,76 16. Тах 0,87 18. Айн 0,71 20. Fa 0,80 22. Каф 0,87 24. Мим 0,77 26. Ха- 0,82 28. Yaa

    Hijja DataSet AHCD DataSet
    CNN-for-AHCD Наша модель CNN -для-AHCD Наша модель
    P R F1 Р R F1 Р R F1 Р R

    1.Алиф 0,93 0,97 0,95 0,97 0,98 0,98 0,96 0,99 0,98 0,96 1,00 0,98
    0,82 0,91 0.86 0.93 0.96 0,96 0.94 0,97 0,97 0,97 0,97 0,99 0,97 0,98 0,98
    3.Чай 0,66 0,88 0,75 0,84 0,92 0,88 0,87 0,95 0,91 0,96 0,95 0,95
    0,76 0,81 0.78 0.94 0.94 0,93 0,93 0,95 0,95 0.92 0,92 0,95 0,95 0,96 0,96
    5.Застревание 0,79 0,85 0,82 0,80 0,90 0,84 0,95 0,96 0,95 0,99 0,98 0,99
    0,83 0,60 0,70389 0,70 0,85 0.89 0.87 0.93 0.93 0.93 0.93 0.93 0.96 0,96 0,97
    7. Khaa 0.76 0,77 0,82 0,73 0,77 0,94 0,93 0,93 0,99 0,96 0,97
    0,65 0,69 0,67 0.79 0.68 0.68 0.73 0,91 0,91 0,94 0,95 0.95 0.88 0.92 0.92
    9. Thaal 0.70 0,69 0,83 0,92 0,87 0,96 0,91 0,93 0,88 0,95 0,92
    0,86 0,87 0,87 0.81 0.91 0.91 0.86 0.89 0.98 0.94 0,94 0,94 0.94 0.96 0,96
    11. Zaay 0.87 0,88 0,96 0,90 0,93 0,94 0,88 0,91 0,96 0,92 0,94
    0,84 0,92 0,88 0.95 0.92 0.92 0.94 0,95 0,91 0,91 0,93 0.00 0.97 0.97 0.97
    13. Шин 0.86 0,84 0,90 0,88 0,89 0,92 0,98 0,95 0,99 1,00 1,00
    0,75 0,81 0,78 0,90 0.86 0.88 0.84 0.84 0.96 0,96 0,90 0,96 0,97 0,97 0,97
    15. Dhad 0.80 0,78 0,91 0,93 0,92 1,00 0,89 0,94 0,97 0,95 0,96
    0,90 0,83 0,87 0.96 0.89 0.92 0.92 0,96 0,94 0,95 0,94 0,94 0,96 0,96 0,96
    17. DHA 0.83 0,85 0,84 0,82 0,83 0,97 0,94 0,95 0,97 0,95 0,96
    0,74 0,70 0,71 0,86 0.86 0.86 0.86 0.90 0,90 0,90 0,92 0,98 0,98 0,98 0,98
    19. Ghen 0.83 0,77 0,75 0,86 0,80 0,89 0,97 0,93 0,98 0,99 0,99
    0,77 0,65 0,71 0.92 0.87 0.89 0.89 0.92 0.84 0.84 0.88 0,94 0,98 0,96 0,96
    21. QAF 0.81 0,81 0,87 0,89 0,88 0,87 0,91 0,89 0,99 0,95 0,97
    0,86 0,78 0,82 0.93 0.89 0.91 0.91 0.98 0,96 0,96 0,96 0,98 0,96 0,96 0,96
    23. Lam 0.90 0,88 0,91 0,89 0,90 0,98 0,97 0,98 0,99 0,98 0,99
    0,83 0,85 0,84 0,82 0.80389 0.80389 0.81 0.81 0.98 0,98 0,98 0,98 0,98 0,98 0,98 0,98
    25. Noon 0.70 0,73 0,88 0,83 0,86 0,92 0,92 0,92 0,86 0,97 0,91
    0,81 0,76 0,78 0.89 0.94 0.94 0,91 0.97 0,96 0,96 0,96 0,96 0,96 0,96 0,97
    27. WAW 0.930 0,87 0,94 0,92 0,93 0,96 0,94 0,95 0,97 0,94 0,95
    0,82 0,81 0,82 0.87 0.82 0.82 0.97 0.97 0,97 0,97 0.97 0.97 0.98 0.98 0.99
    29. Hamza 0.74 0.73 0.74 Na Na Na Na Na Na Na
    (поезд) 0.88 0,98 0,91 1.00
    (тест) 0.80 0,88 0,94 0,96
    Макро ср 0,81 0,80 0,80 0,88 0,88 0,88 0,94 0.94 0.94 0.94 0,97 0.97 0,96 0,96 0,96 0,96
    Взвешенный AVG 0,81 0.81 0.80 0,80 0,89 0,88 0,88 0,94 0,94 0,94 0,97 0,96 0,96

    Заметим, что наша модель превосходит по CNN -для-AHCD с большим отрывом по всем показателям.

    На рисунке 9 показан результат тестирования AUC набора данных AHCD и Hijja.

    7.4. Алгоритмы оптимизатора

    Цель состоит в том, чтобы выбрать лучшие алгоритмы оптимизатора, которые соответствуют наилучшей производительности AHCD и Hijja.В этом контексте мы проверили влияние следующих алгоритмов на классификацию рукописных арабских символов: (i) Адам (ii) SGD (iii) RMSprop (iv) AdaGrad (v) Nadam (vi) Momentum (vii) AdaMax

    Используя алгоритм оптимизации Nadam в наборе данных Hijja, наша модель достигла средней общей точности тестового набора 88,57%, точности 87,86%, отзыва 87,98% и оценки F1 87,95%.

    В наборе данных AHCD наша модель достигла средней общей точности тестового набора 96,73%, точность 96.80%, отзыв 96,73% и оценка F1 96,72%.

    Детальные результаты алгоритмов различных оптимизаций упоминаются в Таблице 4.

    Алгоритм 9944 95.68 95.68 99.77 97.76 9977 97.01 97.86

    Точность (%) Точность (%) Точность (%) Рекортование (%) F1 (%)
    AHCD Хиджа AHCD Хиджа AHCD Хиджа AHCD Хиджа
    Обучение Тестирование Обучение Тестирование Обучение Тестирование Обучение Тестирование Тестирование Тестирование Тестирование Тестирование Тестирование Тренировка Тестирование Обучение Тестирование

    Adam 99.76 96,66 97,60 88,46 99,76 96,75 97,40 87,98 99,76 96,67 97,60 88,46 99,76 96,67 97,60 88,47
    SGD 9944 95.68 94.16 87.85 994 9589 9945 95.84 94.28 94.28 87.93 99,45 95 95.68 94,16 87,85 99,45 95,70 94,17 87,88
    RMSprop 99,72 96,22 96,55 87,98 99,73 96,30 94,28 87,86 99.72 96389 96.22 94.16 87.98 99.72 962 96.23 94.17 87,95 87.95
    Adagrad 88.62 83,54 63,90 60,37 88,73 83,78 87,86 64,95 88,62 83,54 87,98 63,91 88,60 83,52 87,95 63,77
    Надам 96.73 97.76 88.57 88.57 99.77 96.80 97,57 87,86 99,77 96,73 97,76 87,98 99,77 96,72 97,76 87.95
    Momentum 99.16 95.56 94.16 87.76 996 99,18 95.72 94.11 87,73 99,17 95,57 94,17 87,77 99,17 95,58 94,15 87,74
    AdaMax 99,89 96,19 97,19 87,57 99,90 96.25 97.01 87.86 99.90 96.19 97.19 97.19 87.98 99.90 96.19 96.19 97.20 87.95

    7.5. Результаты методов увеличения данных

    Как правило, производительность нейронной сети улучшается за счет хорошей настройки гиперпараметров модели. Такое повышение точности CNN связано с наличием обучающего набора данных. Тем не менее, сети сильно зависят от больших данных, чтобы избежать проблемы переобучения и работать хорошо.

    Расширение данных — это решение проблемы ограниченности данных.Методы увеличения изображения, используемые и обсуждаемые в этом исследовании, включают геометрические преобразования и увеличение пространства признаков (вращение, сдвиг, переворот и масштабирование), введение шума и смешивание изображений из двух разных наборов данных.

    Для геометрических преобразований и увеличения пространства признаков мы пытаемся правильно выбрать процент вращения, сдвига, отражения и масштабирования модели, обеспечивающей хорошую производительность. Например, если мы повернем базу данных латинских рукописных чисел (MNIST) на 180°, сеть не сможет точно различить рукописные цифры «6» и «9».Аналогичным образом, в наборах данных AHCD и Hijja, если используются методы вращения или переворачивания, сеть не сможет различить некоторые рукописные арабские символы. Например, как показано на рисунке 10, при повороте на 180° изолированный символ Дааль (د) будет таким же, как изолированный символ Полдень (ن).

    Подробные результаты вращения, смещения, переворачивания и масштабирования методов увеличения данных упоминаются в Таблице 5.



    DataSet Техника дополнения данных с использованием Nadam Algorithm
    Вращение Перемена Вращение и смещение Flipping Zooming
    точности обучения Тестирование точности точности обучения Тестирование точности точности обучения Тестирование точности точность Обучение Тестирование точности Точность обучения Точность тестирования

    AHCD 99.82 97,64 99,56 98,09 99,41 98,48 99,69 97,29 99,85 98,00
    Хиджа 97,18 89,86 92,72 90,28 91.73 91.24 95.39 88.94 9916 9916 88.66


    Как показано в таблице 5 и рисунок 11, используя подходы к вращению и переключению, наша модель достигла точность тестирования 98.48% и 91,24% для набора данных AHCD и набора данных Hijja соответственно. Мы достигли такой точности, повернув исходное изображение на 10° и сдвинув его всего на один пиксель.

    Добавление шума — это метод, используемый для увеличения входных данных для обучения. Кроме того, в большинстве случаев это должно повысить надежность нашей сети.

    В этой работе мы использовали три типа шума для дополнения наших данных: (i) Гауссовский шум (ii) Шум соли и перца (iii) Спекл-шум

    Подробные результаты различных типов введения шума приведены в Таблица 6.Как показано, добавление различных типов шума повышает точность модели, что демонстрирует надежность предложенной нами архитектуры. Мы добились хороших результатов при добавлении шума к выходам каждого слоя.


    Тип впрыска шума с использованием Nadam алгоритма
    гауссов шум Соль-и-перец шум спекл шума
    точность Обучение Тестирование точности Точность обучения Точность тестирования Точность обучения Точность тестирования

    AHCD17 96,78 99,16 97,15 99,14 96,82
    Хиджа 97,18 89,85 92,96 90,10 91,32 89,73

    Предлагаемая идея в этом исследовании состоит в том, чтобы увеличить количество обучающих баз данных путем смешивания двух наборов данных AHCD и Hijja, а затем применить ранее упомянутые методы увеличения данных к новому смешанному набору данных.Наша цель использовать искаженные рукописные символы, поскольку он предлагает набор данных Hijja, состоит в том, чтобы повысить точность нашего метода с зашумленными данными.

    Подробные результаты методов увеличения данных в смешанной базе данных приведены в таблице 7. Как показано, производительность модели зависит от скорости использования базы данных арабского почерка «Хиджа». Детям было трудно следовать справочному документу, что приводило к изображениям с очень низким разрешением, содержащим много нечетких символов. Поэтому смешивание наборов данных, безусловно, снизит производительность.


    Смешанный набор данных методики дополнения данных с использованием алгоритма Nadam
    вращения Смещение Вращение и смещение Flipping гауссов шум
    Обучение Тестирование точность Обучение Тестирование точности точность Обучение Тестирование точности точность Обучение Тестирование точности точность Обучение Тестирование точности точности обучения точности Тестирование

    80(%): AHCD
    20(%): Хиджа
    20(%): AHCD
    10(%): Хиджа
    99.62 97,42 99,36 98,02 99,38 98,32 99,77 97,08 99,15 96,74
    80 (%): Хиджа
    20 (%): AHCD
    20 (%): Хиджа
    10 (%): AHCD
    97,36 88,47 93,66 89,07 94,91 90,54 95,21 88.21 96,68 88.49
    80 ( %): AHCD
    80(%): Хиджа
    20(%): AHCD
    20(%): Хиджа
    97.27 74,53 97,16 75,13 98,13 78,13 98,16 74,22 96,98 74,02

    8. Выводы и возможные направления будущих исследований

    В этой статье мы предложили сверточную нейронную сеть (CNN) для распознавания набора данных арабских рукописных символов. Мы обучили модель на двух арабских наборах данных AHCD и Hijja.Благодаря хорошей настройке гиперпараметров сети мы достигли точности 96,73% и 88,57% на AHCD и Hijja.

    Для повышения производительности модели мы реализовали различные алгоритмы оптимизации. Для обеих баз данных мы добились отличной производительности с помощью оптимизатора Nadam.

    Чтобы решить проблему нехватки наборов рукописных данных на арабском языке, мы применили различные методы увеличения данных. Подходы к увеличению основаны на геометрическом преобразовании, увеличении пространства признаков, введении шума и смешивании наборов данных.

    Используя методы вращения и смещения, мы достигли хорошей точности, равной 98,48% и 91,24% на AHCD и Hijja.

    Чтобы повысить надежность модели CNN и увеличить количество обучающих наборов данных, мы добавили три типа шума (гауссов шум, соль и перец и спекл-шум).

    Также в этой работе мы сначала увеличили базу данных, смешав два набора данных арабских рукописных символов; затем мы проверили результаты ранее упомянутых методов увеличения данных на новом смешанном наборе данных, где первая база данных «AHCD» содержит четкие изображения с очень хорошим разрешением, а вторая база данных «Хиджа» содержит много искаженных символов.Экспериментально покажите, что геометрические преобразования (вращение, смещение и отражение), увеличение пространства признаков и введение шума всегда улучшают производительность сети, но скорость использования нечистой базы данных «Хиджа» снижает точность модели.

    Интересным будущим направлением является очистка и обработка набора данных Hijja для устранения проблемы нечетких изображений с низким разрешением, а затем внедрение предложенной сети CNN и методов увеличения данных в новой смешанной и очищенной базе данных.

    Кроме того, мы заинтересованы в оценке результатов других подходов к расширению, таких как состязательное обучение, передача нейронного стиля и генеративные состязательные сети, при распознавании наборов данных арабских рукописных символов. Мы планируем включить нашу работу в приложение для детей, которое обучает арабской орфографии.

    Сокращения
    признания
    AHCR: арабских рукописных символов
    DL: Глубокого изучение
    CNNs: сверток нейронных сетей
    AHCD: арабских набор данные рукописных символов
    SVM: Поддержка векторной машины
    ADBase: база данных арабские цифры
    HACDB: Рукописные Arabic базы данных символов
    OIHACDB: Offline базы данных рукописных арабский символ
    CDCGAN : Условные глубокие свертки генеративные состязательные сети
    TANH: TANH: Гиперболический касательный
    RELU: RELU: RELU:
    CE: Кросс-энтропия
    GD: GADI Ent descent
    NAG:: Nesterov Ускоренный градиент
    TP: TP: TP:
    FP: FALE Positive
    FN: FALE отрицательный
    TN: Истинный отрицательный
    ::::::
    ROC: Receiver Curve
    ELU: Экспоненциальный линейный блок
    символы
    Фильтр:: α : ε : ε :
    : изображение
    :: Ширина и высота изображения
    : Количество каналов
    :
    : Размер фильтра
    ⊗: Световая эксплуатация
    : Карта свертки
    : Размер свертки карте
    : Страйд
    : Набивка
    : Нелинейная функция активации
    : Свертка карту после нанесения
    : Ядро
    : Количество пластырей
    : операция Аккумулирование
    : Аккумулирование отображающих
    : конкатенация вектор
    : выходе сверточного слоя
    :: Крубленные изображения
    ::
    : Выход полностью подключенного Скрытого слоя
    : Вес вектора
    : Смещение
    : Затраты
    :: До желания
    :
    Модель обучения
    : Momentum
    :
    :::
    ε : Сглаживание
    : Сумма квадратов градиента
    : Распадивание
    :: Моменты Вектор
    ::: Ставка
    : Средство предыдущего градиента
    : Дисперсия предыдущего градиента.
    Доступность данных

    Ранее представленные данные AHCD использовались для поддержки этого исследования и доступны по адресу https://www.kaggle.com/mloey1/ahcd1. Эти предыдущие исследования (и наборы данных) цитируются в соответствующих местах в тексте как [43].

    Конфликт интересов

    Авторы заявляют об отсутствии конфликта интересов в отношении публикации данного исследования.

    Метод классификации SVM на основе классов соседей для оптического распознавания китайских иероглифов

    Abstract

    Для оптического распознавания печатных китайских символов (OPCCR) было предложено множество классификаторов для распознавания.Среди классификаторов лучшим классификатором может быть машина опорных векторов (SVM). Однако SVM является классификатором для двух классов. Когда он используется для мультиклассов в OPCCR, его вычисление занимает много времени. Таким образом, мы предлагаем SVM на основе классов соседей (NC-SVM), чтобы уменьшить потребление вычислений SVM. Были проведены эксперименты по классификации NC-SVM для OPCCR. Результаты экспериментов показали, что предложенная нами NC-SVM позволяет эффективно сократить время вычислений в OPCCR.

    Образец цитирования: Zhang J, Wu X, Yu Y, Luo D (2013) Метод классификации SVM на основе классов соседей для распознавания китайских иероглифов с оптической печатью.ПЛОС ОДИН 8(3): е57928. https://doi.org/10.1371/journal.pone.0057928

    Редактор: Дерек Эбботт, Университет Аделаиды, Австралия

    Поступила в редакцию: 29 октября 2012 г.; Принято: 28 января 2013 г.; Опубликовано: 11 марта 2013 г.

    Авторские права: © 2013 Zhang et al. Это статья с открытым доступом, распространяемая в соответствии с лицензией Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания оригинального автора и источника.

    Финансирование: Авторы не имеют поддержки или финансирования для отчета.

    Конкурирующие интересы: Авторы заявили об отсутствии конкурирующих интересов.

    Введение

    Для китайских иероглифов существуют сотни похожих групп символов, таких как и , и , , , и , и так далее. В каждой группе сложно классифицировать похожие символы в оптическом печатном распознавании китайских символов (OPCCR). Чтобы преодолеть эту трудность, было разработано множество классификаторов [1]–[9].Некоторые эксперименты [4] [10]–[13], проведенные в последние годы, показали, что метод SVM может обеспечить высокую скорость идентификации (IR) во многих наборах данных, таких как набор данных MNIST, набор данных ETL8B, набор данных ETL9B и т. д. Однако SVM [1] –[4] — классификатор, используемый для двух классов. Когда он используется для больших мультиклассов в OPCCR, его вычисление занимает много времени. Это связано с тем, что обучение и классификация нескольких классов в SVM должны выполняться между каждой парой всех классов. По этой причине было предложено несколько методов сокращения вычислений SVM.

    Типовой метод k ближайших соседей SVM (SVM-KNN) [5]–[6] был предложен для сокращения количества обучающих процедур в SVM. В методе SVM-KNN [6] сначала находятся k ближайших соседей (KNN) выборки запроса путем вычисления расстояний запроса до всех обучающих выборок. Затем к k ближайшим соседям, если метки этих выборок различны, вычисляется матрица попарных расстояний между k соседями, и преобразуется в матрицу ядра, а затем SVM направленного ациклического графа (DAGSVM) [14] обучается по матрице ядра.Хотя процедуры обучения SVM сокращаются, это приводит к дополнительному времени вычисления k ближайших соседей ко всем обучающим примерам. Хотя метод классификатора локального ближайшего соседа (LNN) был предложен в комбинированном методе SVM и KNN [7], он использовался для улучшения SVM, но не для сокращения вычислений. Локальные выборки ближайших соседей были извлечены для построения локальных классификаторов SVM, когда глобальная классификация SVM не удалась. Граница класса, предоставленная локальной SVM, используется для изучения зависящей от запроса метрики, основанной на границах, где найдено 90 227 k 90 228 ближайших соседей, за которыми следует классификатор KNN для запроса.Точно так же в [8] был предложен метод классификатора ближайшего соседа (NNC) с SVM, когда выходы глобальных классификаторов SVM представляют собой разные метки. Было предложено увеличить классификацию SVM, а не уменьшить вычислительные затраты на распознавание. На этапе обучения применяется глобальный метод SVM. В процессе тестирования для классификации образца запроса используются как глобальный SVM, так и NNC. Был предложен еще один типичный метод — локальный адаптивный SVM-классификатор (LASVM) [9]. В процедуре обучения классификатор LASVM обучается в соответствии с зависящей от даты матрицей расстояний обучающих данных.В процедуре классификации, если k ближайших соседей выборки запроса имеют более одной метки, для дальнейшего распознавания используется локальный SVM. k ближайших соседей обычно имеют разные метки, поэтому метод LASVM менее эффективен для сокращения вычислений. Чтобы еще больше сократить вычисление SVM, мы предлагаем здесь метод NC-SVM для OPCCR. В нашем методе сначала пространство шаблонов китайских иероглифов разбивается на подпространства. В соответствии с подпространством строится контейнер.Классы в подпространстве хранятся в соответствующем контейнере. Затем в процедуре обучения OPCCR известная обучающая выборка и соседние классы (NC) выборки используются для обучения SVM. В процедуре классификации неизвестный образец классифицируется SVM с использованием НК неизвестного образца. Таким образом, вычисление OPCCR с помощью SVM значительно сокращается. Чтобы проиллюстрировать метод NC-SVM и сравнить его с другими методами SVM на основе локальных соседей, во-первых, вводится разделение пространства шаблонов.Далее указывается обучение SVM и NC-SVM и классификация по SVM и NC-SVM. Затем представлена ​​производительность NC-SVM в OPCCR. Наконец, приведены некоторые экспериментальные результаты OPCCR с помощью NC-SVM. Между тем, потребление вычислений NC-SVM сравнивается с SVM-KNN [6], GsvmLBDknn [7], SVM-NNC [8] и LASVM [9] и модифицированной квадратичной дискриминантной функцией 2 (MQDF2) [15].

    Методы

    2.1 Разделение пространства шаблонов NC-SVM

    Как известно, алгоритм SVM подходит для классификации двух линейно или нелинейно разделимых классов.Однако для классификации мультиклассов с помощью SVM каждые два класса из всех классов должны участвовать в классификации неизвестного образца. На самом деле нет необходимости использовать все классы в OPCCR с помощью SVM. Это потому, что класс приближается только к некоторым, но не ко всем классам. Следовательно, для классификации неизвестного образца используются только его соседние классы (NC). Проблема заключается в том, как определить, какие соседние классы используются. Чтобы решить эту проблему, мы разобьем пространство шаблонов китайских иероглифов на подпространства.В подпространстве классы, попадающие в это подпространство, считаются соседями. Таким образом, когда неизвестный образец классифицируется, SVM использует классы в подпространстве, где находится неизвестный образец. Пример разделения пространства двухмерного шаблона и неизвестного образца показан на рисунке 1. На рисунке пространство двухмерного шаблона разделено на 9 подпространств. Когда неизвестная выборка стоит в центральном подпространстве, классы в центральном подпространстве: класс 1, 2, 3 являются его соседними классами.

    Рисунок 1. Разделение пространства двухмерного шаблона.

    Пространство шаблонов двух измерений разделено на 3 2 подпространств. Подпространство { u 01 , u 11 } в центре соответствует контейнеру c 4 . Номер контейнера рассчитывается по уравнению (6). NC в этом подпространстве, т.е. класса 1, 2 и 3, сохраняются в контейнере c 4  = {1,2,3}.

    https://doi.org/10.1371/журнал.pone.0057928.g001

    Пусть P D будет D пространственным шаблоном оптических печатных китайских иероглифов (OPCC): (1) Где 0≤ p i ≤1 это i й признак, i  = 0, 1, …, D −1. Каждое измерение пространства шаблона разделено на единиц U .(2)

    Номер блока j можно рассчитать по формуле:(3)

    Таким образом, пространство шаблонов P D разделено на подпространства U D : (4) (5) Соответствующее подпространству { u ij }, контейнер c построен.В контейнере c m хранятся номера классов в подпространстве { u ij }. Число m вычисляется по формуле: (6)

    Например, на рисунке 1 D  = 2, U  = 3. Подпространству { u 01 , u 11 } соответствует единица измерения двух измерений (1, 1) , м  = 1×1+1×3 = 4.

    2.2 Обучение SVM и NC-SVM

    В случае мультиклассов для каждых двух классов a и b по одному суперплоскости.(7) должен быть создан для разделения двух классов a и b . Здесь a , b  = 1, 2, …, L , L — количество классов. Следовательно, для класса a число n a суперплоскостей, которые должны быть сгенерированы, определяется как:

    (8)Для всех классов номер n t суперсамолетов равен(9)

    В каждой суперплоскости матрица W ab должна быть оптимизирована с использованием обучающих выборок X a , выбранных из класса a и X b из класса b . супер самолет.Очевидно, что для класса, когда используется одна обучающая выборка, необходимо ( L −1) раз обучения, чтобы сгенерировать ( L −1) суперплоскостей. Для всех классов требуется L ( L −1)/2 раза обучения. Когда для класса используются обучающие образцы S , необходимо время обучения t a : (10)

    Для всех классов необходимо время t t обучения:(11)

    Следовательно, обучение SVM занимает много времени.

    В NC-SVM, если обучающая выборка имеет L t классов-соседей, то необходимо сгенерировать количество суперплоскостей.(12)

    Например, как на рисунке 1, лысая обучающая выборка класса 2 имеет два соседних класса: класс 1 и класс 3. При ее использовании требуется обучение только двух суперплоскостей класса 2 и 1, класса 2 и 3. . Аналогично лысая обучающая выборка класса 3 имеет два соседних класса: класс 1 и класс 2. При ее использовании необходимо обучать только две суперплоскости класса 3 и 1, класса 3 и 2.Таким образом, общее количество суперплоскостей, подлежащих обучению, равно 3. Когда используются обучающие образцы S , необходимо время обучения: (13)

    Таким образом, для всех классов необходимо время обучения:(14)

    Существует около L  = 6000 часто используемых китайских иероглифов. В группе однотипных символов не более L t  = 10 символов. В OPCCR, когда пространство шаблонов равномерно разделено на более чем 6000 подпространств, количество NC L t меньше, чем L .Сравнивая уравнения (14) с уравнением (11), время обучения NC-SVM намного меньше, чем у SVM.

    2.3 Классификация по SVM и NC-SVM

    В случае мультиклассов, начиная с класса а, суперплоскости класса a и каждого из других классов b используются для классификации выборки X . Если образец X удовлетворяет суперплоскости: (15)

    Затем X классифицируется в класс a .В противном случае: (16)

    Затем X классифицируется в класс b . Таким образом, для классов L количество суперплоскостей, необходимых для классификации X , составляет: (17)

    Таким образом, классификация SVM требует много времени.

    NC-SVM может сократить время классификации. В NC-SVM, если неизвестный образец имеет L u классов-соседей, количество суперплоскостей, необходимых для классификации неизвестного образца X , составляет: (18)

    Например, на рисунке 1 неизвестная выборка имеет 3 соседних класса.При запуске из класса 1 для классификации неизвестного образца необходимы 2 суперплоскости 1 и 2 класса, 1 и 3 класса или 2 суперплоскости 1 и 2 класса, 2 и 3 класса. В OPCCR большая часть L u меньше, чем L . Следовательно, сравнивая уравнение (18) с уравнением (17), время классификации NC-SVM намного меньше, чем у SVM.

    2.4 Внедрение NC-SVM в OPCCR

    Общая схема всей системы распознавания показана на рисунке 2.Во-первых, оптически напечатанное изображение китайских иероглифов предварительно обрабатывается для уменьшения неравномерного освещения. Далее изображение сегментируется для получения отдельных неизвестных символов. Затем извлекаются черты неизвестного персонажа. Из базы данных признаков OPCC выбираются соседние классы неизвестного символа. Наконец, неизвестный символ распознается SVM с использованием классов-соседей. Тем временем база данных признаков OPCC обновляется SVM с использованием выходных данных.

    Рис. 2.Общая схема всей системы распознавания.

    Изображение OPCC предварительно обработано для уменьшения неравномерного освещения. Затем он сегментируется на отдельные изображения персонажей. Особенности изображения отдельного персонажа извлекаются и сохраняются в базе данных функций OPCC. Из базы данных признаков OPCC создается контейнер каждого подпространства шаблонов. Неизвестный образец, упавший в контейнер, распознается SVM с помощью НК в контейнере. База данных объектов OPCC и NC в контейнере обновляются выходными данными.

    https://doi.org/10.1371/journal.pone.0057928.g002

    Можно использовать некоторые методы извлечения признаков, как указано в ссылках [16]–[30]. Однако эти способы либо сложны, либо требуют много времени. По этой причине простая вероятность выделения точек штриха (PSP) может быть принята следующим образом.

    Пусть b(x, y) будет бинарным изображением отдельного OPCC. Вот, x = 0, 1, …, h 1 и y и y = 0, 1, …, w 1 , h — высота и w ширина изображения OPCC.В двоичном изображении b(x, y) пиксель со значением 1 (единица черного цвета) является точкой штриха, а пиксель со значением 0 (ноль белого цвета) является фоновой точкой. Бинарное изображение b(x, y) разделено на R × C блоков. Здесь R — количество строк, а C — количество столбцов блоков. Тогда высота h блока равна h = H/R , а ширина w = W/C . Для каждого блока PSP рассчитывается как характеристика: (19)

    Таким образом, D = R × C признаков извлекаются для формирования размерного шаблона D P D , как описано в уравнении (1).Номер размера i из p i рассчитывается по формуле: (20)

    Для каждого измерения i диапазон p i делится на единицы u ij , как описано в уравнении (2). Номер блока j из u ij рассчитывается по уравнению (3). Затем пространство шаблонов P D разбивается на подпространства U D , как описано в уравнениях (4) и (5).Каждому подпространству { u ij } соответствует контейнер c m . Число m рассчитывается по уравнению (5) и (6). Номера классов персонажей хранятся в соответствующем контейнере: (21)

    .

    Пример контейнера и хранимых классов показан на рисунке 1, где контейнер 4, т.е. контейнер c 4 по адресу (1, 1), содержит классы 1, 2 и 3.(22)

    В процедуре обучения NC-SVM выберите обучающую выборку из класса.Найдите контейнер выборки по уравнению (5) и (6) и его соседние классы в контейнере по уравнению (21). Например, на рисунке 1 выберите обучающую выборку класса 2 в жирном квадрате и обучающую выборку класса 3 в жирном треугольнике. Два образца находятся в контейнере 4, а их соседние классы — это классы 1, 2 и 3. Затем используйте соседние классы для обучения SVM.

    В процедуре классификации NC-SVM контейнер неизвестного образца находится в соответствии с уравнением (5) и (6), а его соседние классы в контейнере — в соответствии с уравнением (21).Например, на рисунке 1 неизвестный образец, отмеченный серой звездочкой, находится в контейнере 4. Его соседние классы — это классы 1, 2 и 3. Затем используйте соседние классы и SVM для классификации неизвестного образца.

    Эксперименты

    Для проверки нашего метода классификации NC-SVM в OPCCR было проведено несколько экспериментов. Сначала были получены и предварительно обработаны изображения OPCC. Затем было выполнено извлечение признаков PSP и распознавание OPCC.

    3.1 Получение и обработка изображений

    На листах бумаги было напечатано

    OPCC с разными стилями и размерами шрифта.Изображения листов были получены с помощью цифровой камеры. Изображения были улучшены с помощью адаптивной коррекции фона для устранения неравномерного освещения. Адаптивная коррекция фона определяется как: (23)

    Где M(x, y) — средний фильтр размером R × C , f(x, y) — полученное изображение, g(x, y) — улучшенное изображение . R и C — это строка и столбец фильтра. Они предварительно разработаны в соответствии с размером изображения.В наших экспериментах R  = 0,05 D , C  = 0,05 D , D является минимумом строки и столбца изображения.

    Поскольку SVM-классификатор подходит для классификации дисперсионных образцов, искажение изображения небольшое и в наших экспериментах не исправляется.

    Затем они были сегментированы на бинарные изображения пороговым методом. Бинарные изображения были разрезаны на отдельные символы проекционным методом для получения OPCC.Некоторые примеры символов показаны на рис. 3. OPCC были сохранены в базе данных образцов китайских иероглифов для извлечения функций PSP.

    Рисунок 3. Некоторые образцы OPCC со стилем шрифта SimSun.

    Представлено 100 отдельных бинарных изображений OPCC. Эти изображения предварительно обработаны методом адаптивной коррекции фона для уменьшения неравномерности освещения и нормализованы до 64×64.

    https://doi.org/10.1371/journal.pone.0057928.g003

    3.2 Извлечение функций PSP

    Каждое из предварительно обработанных изображений отдельных персонажей было разделено на блоки размером 16×16. В каждом блоке вычислялась вероятность точек удара по уравнению (19). Вероятность была принята за характеристику блока. Таким образом, были получены признаки 16×16 и для изображения символа было построено вероятностное изображение 16×16. Из вероятностного изображения формировался рисунок персонажа по уравнению (1). Размер шаблона 16×16.Образцы иероглифов были сохранены в базе данных характеристик китайских иероглифов для обучения и распознавания.

    3.3 Разделение пространства шаблона и конструкция контейнера

    В OPCCR размер пространства шаблона 16×16 слишком велик для разделения подпространства и построения контейнера. С одной стороны, если каждое измерение разделить на 10 единиц, пространство шаблона будет разделено на 10 16×16 подпространств, и потребуется построить 10 16×16 контейнеров.С другой стороны, на практике обычно используется около 6000 китайских иероглифов, поэтому многие подпространства будут пустыми, а многие подпространства будут содержать только один класс. По этой причине мы уменьшили размерность 16×16 до 2×2 следующим образом: вероятностное изображение 16×16 было разделено на 2×2 = 4 блока. В каждом блоке вероятности суммировались по уравнению (19). Таким образом, пространство шаблона сократилось до 4-х измерений. Каждое измерение было разделено на 10 единиц, а пространство паттернов разделено на 10 4  = 10 000 подпространств.Соответственно, было построено 10 000 контейнеров. Индекс каждого контейнера рассчитывали по уравнению (6). Затем номера классов символов в подпространстве помещались в соответствующий контейнер в соответствии с уравнением (3) и (6).

    3.4 Обучение NC-SVM для OPCCR

    В базе данных признаков для каждого стиля и размера шрифта каждый китайский иероглиф содержит 60 образцов. Во-первых, мы выбрали случайным образом 30 образцов в качестве обучающих. В соответствии с методом строительства контейнера в разделе 6.3 находятся контейнер и соседние классы каждой обучающей выборки. Затем SVM использовался для определения суперплоскостей и опорных векторов между соседними классами. Суперсамолеты были сохранены в базе данных классификатора китайских иероглифов для OPCCR. Опорные векторы были сохранены в базе данных опорных векторов китайских иероглифов для обновления обучения.

    3.5 Распознавание OPCC с использованием NC-SVM для выбранных похожих символов

    В этом эксперименте мы сначала выбрали вручную 368 похожих символов из стандарта GB2312-80 в качестве тестовых целей, которые были отсортированы в 236 групп в соответствии со структурой их символов.Остальные 30 образцов для каждого символа мы выбрали в качестве тестовых образцов. В соответствии с разделом 6.3 найдены классы-контейнеры и соседи каждой тестовой выборки. Радиальная базисная функция (RBF) выбрана в качестве функции ядра для этого эксперимента; Штраф C и γ RBF равен 100 и 0,003 для всех классификаторов NC-SVM [31]. Затем были выбраны суперплоскости между соседними классами для распознавания тестового образца. Между тем, тестовая выборка вместе с опорными векторами между соседними классами использовалась для обновления обучения.

    Сначала выбираются тестовые образцы с одинаковым стилем шрифта SimSun и разным размером шрифта 12, 18, 26 и 36. В таблице 1 показана скорость классификации 236 групп схожих признаков.

    Затем мы выбрали эти похожие группы с 4 стилями шрифта: SimSun, SimHei, KaiTi_GB2312 и FangSong_GB2312 с одинаковым размером шрифта 18 из базы данных образцов китайских иероглифов. Стили и размер шрифта обычно используются в книгах и файлах документов. В таблице 2 приведены классификационные показатели для 236 групп сходных признаков.

    3.6 Сравнение с другими методами

    Чтобы проиллюстрировать эффективность IR и сокращение вычислений нашего метода, мы представляем процесс сравнения с SVM-KNN [6], GsvmLBDknn [7], SVM-NNC [8], LASVM [9] и MQDF2 [15]. .

    Мы фокусируемся на компромиссе между скоростью идентификации OPCCR (IR) и потреблением вычислений (CC). В этом разделе приведены два эксперимента. В первом эксперименте используется набор данных OPCC. В наборе данных в эту симуляцию включены все китайские иероглифы GB2312-80.Каждый символ шрифта типа SimSun с размером шрифта 18 содержит 60 образцов, 30 из них выбираются случайным образом в качестве обучающих образцов в процессе обучения и обучения, 30 из оставшихся выбираются в качестве тестовых образцов в процессе тестирования. Характеристики PSP каждого образца извлекаются по уравнению (19). Построены НК всех элементов массива. Согласно ссылке [6], Ksl соседей равны 800, а K соседей, основанных на Ksl , равны 80. Необязательный Kl соседей запроса в ссылке [7] равен 200.В методе из ссылки [9] параметр k ближайших соседей выбран равным 20. Для проверки обобщения нашего метода представлены три обычно используемые функции ядра SVM, т. е. линейное ядро, полином третьего порядка ядро и ядро ​​RBF. Согласно инструментам LIBSVM [31], параметр штрафа C выбран равным 100, а γ RBF равен 0,003 для всех классификаторов. В MQDF2 собственные значения ковариационной матрицы сортируются в порядке убывания.Значение k , которое указывает количество собственных значений и собственных векторов, которые должны быть зарезервированы, равно 20, а h 2 выбрано как среднее λ 21 для всех классификаторов. Результаты моделирования, включая IR и CC в среднем для каждой выборки запроса (в секундах на выборку), показаны в Таблице 3, Таблице 4 и Таблице 5. Методы в эксперименте кратко обозначены как: M1 для SVM-KNN, M2 для GsvmLBDknn , M3 для SVM-NNC, M4 для LASVM, M5 для NC-SVM и M6 для MQDF2.

    Во втором эксперименте шесть методов с M1 по M6 применяются к набору данных MNIST. База данных рукописных цифр MNIST содержит 60 000 обучающих примеров и 10 000 тестовых примеров. Исходные изображения в наборе данных нормализованы до размера 64×64 пикселя. Процедуры классификации цифр в шести методах такие же, как и в наборе данных OPCC, но выбранные параметры отличаются от набора данных OPCC. Параметр C и γ RBF равен 120 и 0.001. Результаты эксперимента приведены в Таблице 6, Таблице 7 и Таблице 8.

    Из этих таблиц видно, что IR методов существенно не отличаются. CC последних двух методов M5 и M6 намного меньше, чем CC первых четырех методов M1-M4. По сравнению с M6 (MQDF2), M5 (NC-SVM) немного больше потребляет компьютер. Основное отличие NC-SVM заключается в том, что его потребление вычислений заметно меньше, чем у других четырех методов SVM, основанных на локальности. Для метода SVM-KNN, чтобы выбрать k ближайших соседей, мы должны вычислить расстояние запроса до всех обучающих выборок.В нашей базе данных OPCC количество классов равно 6773, а обучающие выборки огромны, поэтому потребление вычислений для 90 227 тыс. 90 228 ближайших соседей явно возрастает. Выбор k локальных соседей также чувствителен к IR. IR падает с небольшими локальными выборками соседей, потому что некоторые локальные классы соседних выборок исключаются из локальных ближайших соседей. GsvmLBDknn дает хороший результат распознавания. Когда глобальная SVM дает сбой, локальная SVM используется для изучения зависящей от запроса метрики, определяемой границами, по которой находятся K ближайших соседей.Затем формируется классификатор KNN для классификации выборки запроса. Учитывая базу данных OPCC с большими классами, глобальный процесс SVM требует гораздо больше вычислительного времени. Таким образом, потребление вычислений быстро увеличивается из-за гибрида глобального SVM и локального классификатора KNN на основе SVM. SVM-NNC сначала использует глобальные классификаторы SVM для идентификации образца запроса. Этот глобальный процесс классификаторов SVM, по-видимому, тратит много вычислительного времени, что приводит к увеличению потребления вычислений.GsvmLBDknn и SVM-NNC подходят для распознавания образов с небольшими номерами классов, поскольку глобальный процесс SVM неявно влияет на время вычислений. LASVM также применим для распознавания с небольшим количеством классов. Для базы данных, содержащей большие классы, хотя глобальный процесс SVM «один против всех» работает, если метки всех 90 227 k 90 228 соседей выборки запроса различны, вычисление этого глобального SVM также будет быстро увеличиваться.

    NC-SVM рассматривает классы соседей выборки запроса, а не k выборок ближайших соседей.Таким образом, все классификаторы его локальных соседей полностью вовлечены в контейнер, соответствующий образцу запроса; ИР поддерживается удовлетворительно. Между тем, количество соседних классов, включенных в каждый контейнер, намного меньше, чем общее количество классов OPCC, которое показано в разделе 3. Таким образом, потребление вычислений для распознавания резко снижается по сравнению с другими методами на основе SVM. Результат моделирования иллюстрирует эффективность сокращения вычислений NC-SVM.

    Обсуждение и заключение

    SVM является оптимальным классификатором.Во многих случаях с помощью классификатора SVM можно добиться высокого IR. Однако в случае с несколькими классами SVM требует много времени для вычислений. Таким образом, в нашем OPCCR мы предлагаем метод NC-SVM для сокращения времени вычислений SVM. Метод NC-SVM имеет такую ​​же скорость идентификации (IR), что и пять методов: SVM-KNN, GsvmLBDknn, SVM-NNC, LASVM и MQDF2. Вычислительные затраты времени (CC) намного меньше, чем у первых четырех методов, но немного больше, чем у метода MQDF2.

    На этапе обучения для обучения классификатора SVM используются только обучающие выборки в соседних классах (NC), но не все обучающие выборки.На этапе классификации выбираются только соседние классы, но не все классы для распознавания неизвестного образца. Количество NC меньше, чем у всех классов китайских иероглифов, поэтому время обучения и время классификации значительно сокращаются.

    В пространстве шаблонов OPCCR образцы в соседних классах неизвестного образца близки к неизвестному образцу, но другие образцы других классов находятся далеко от неизвестного образца. Следовательно, другие образцы, не используемые на этапе обучения и классификации, не повлияют на скорость идентификации.Таким образом, IR NC-SVM существенно не отличается от пяти методов.

    В NC-SVM разделение пространства шаблонов повлияет на IR и CC OPCCR. Чем больше подпространство, тем больше NC и больше IR, но больше CC. Наоборот, чем меньше НК и тем меньше ИР, но меньше КК. Связь между разделением и IR/CC будет изучена в будущем.

    Вклад авторов

    Задумал и разработал эксперименты: JZ XW YY DL.Выполнял эксперименты: JZ DL. Проанализированы данные: JZ DL. Предоставленные реагенты/материалы/инструменты для анализа: JZ DL. Написал статью: JZ DL.

    Каталожные номера

    1. 1. Christopher JCB (1998) Учебное пособие по машинам опорных векторов для распознавания образов. Данные Min Know Discov 2 (2): 121–167.
    2. 2. Лян З., Нобору Т. (2007) Применение машин опорных векторов к проблеме классификации китайских иероглифов. Conf Proc IEEE Int Conf Syst Man Cybern: 3604–3608.
    3. 3. Jian-xiong D, Adam K, Ching YS (2005) Усовершенствованная система распознавания рукописных китайских иероглифов с использованием машины опорных векторов. Pattern Recognit Lett 26 (12): 1849–1856.
    4. 4. Ченг-Лин Л., Хиромичи Ф. (2008)Классификация и обучение распознаванию символов: сравнение методов и оставшиеся проблемы. В: Симоне М., Хиромичи Ф., редакторы. Машинное обучение в анализе и распознавании документов. Гейдельберг: Springer Berlin Heidelberg. 139–161.
    5. 5. Лам Х.Л., Чин Х.В., Тьен Ф.Ю., Хуэй М.К. (2010) Обзор гибридных моделей классификации машин с поддержкой ближайших соседей. J Appl Sci 10 (17): 1841–1858.
    6. 6. Zhang H, Berg AC, Maire M, Malik J (2006) SVM-KNN: дискриминационная классификация ближайших соседей для визуального распознавания категорий. Proc IEEE Comput Soc Conf Comput Vis Pattern Recognit 2: 2126–2136.
    7. 7. Wei X, Ong SH, Le TT, Joo HL, Jiang L, et al.. (2009) Объединение глобального SVM и локальных классификаторов ближайших соседей, управляемых локальными дискриминационными границами.IEEE Conf Industr Electro Appl: 3597–3600.
    8. 8. Yankun Z, Chongqing L (2003)Распознавание лиц на основе метода опорных векторов и классификатора ближайшего соседа, J Syst Eng Electro. 14(3): 73–76.
    9. 9. Zaidi NA, Squire DM (2010)Локальный адаптивный SVM для распознавания объектов. ДИКТА: 196–201.
    10. 10. Taiwu X, Bang Z (2011) Распознавание рукописных китайских иероглифов на основе метода опорных векторов наименьших квадратов. В: Дэвид Дж., Салли Л., редакторы.Достижения в области компьютерных наук, интеллектуальных систем и окружающей среды. Гейдельберг: Springer Berlin Heidelberg. стр. 219–227.
    11. 11. Fu C, Chan-Cheng L (2012)Дерево решений как ускоритель для машин опорных векторов. дои: 10.5772/52227.
    12. 12. Fu C, Chien-Hsing C, Chin-chin, Chun-Jen C (2004) Прототип метода классификации и его применение для распознавания рукописных символов. Conf Proc IEEE Int Conf Syst Man Cybern 5: 4738–4743.
    13. 13. Д. Импедово, Г. Пирло, Р. Модуньо (2012) Новые достижения в распознавании рукописных символов на основе зонирования.IEEE Int Conf Front Handwriting Recognition: 661–665.
    14. 14. John CP, Nello C, John ST (2000) DAG с большим запасом для мультиклассовой классификации. Кембридж: MIT Press. 547–553 стр.
    15. 15. Фумитака К., Кенджи Т., Синдзи Т., Ясудзи М. (1987) Модифицированные квадратичные дискриминантные функции и приложение к распознаванию китайских иероглифов. IEEE Trans Pattern Anal Mach Intell 9 (1): 149–153.
    16. 16. Чиен-Ченг Т., Чанг-Юнг Дж., Хис-Ченг С., Джин-Фонг Л. (1998) Оптимальный алгоритм извлечения линейных сегментов для онлайн-распознавания китайских иероглифов с использованием динамического программирования.Письмо о распознавании образов 19 (10): 953–961.
    17. 17. Chungnan L, Bohom W (1998) Алгоритм извлечения штрихов китайских иероглифов на основе информации о контурах. Распознавание образов 31(6): 651–663.
    18. 18. Yi-Hong T (1998) Ускорение распознавания китайских иероглифов в системе автоматического чтения документов. Распознавание образов 31 (11): 1601–1612.
    19. 19. Jin WK, Kwang IK, Bong JC, Hang JK (1999) Разложение китайских иероглифов на штрихи с использованием математической морфологии.Письмо о распознавании образов 20 (3): 285–292.
    20. 20. Hung-Pin C, Din-Chang T (1999) Новое извлечение признаков на основе штрихов для распознавания рукописных китайских иероглифов Pattern Recognition. 32 (12): 1947–1959.
    21. 21. Jung-pil S (2002) Оптимальный метод поиска соответствия штриха для распознавания символов в сети. Письмо о распознавании образов 23 (5): 601–608.
    22. 22. Yih-Ming S, Jhing-Fa W (2003) Процесс обучения идентификации характерных точек китайских иероглифов.IEEE Trans Syst Man Cybern A Syst Hum 33 (3): 386–395.
    23. 23. Yih-Ming S, Jhing-Fa W (2003) Новый метод извлечения штрихов для китайских иероглифов с использованием фильтров Габора. Распознавание образов 36(3): 635–647.
    24. 24. Yih-Ming S, Jhing-Fa W (2004) Разложение китайских иероглифов на сегменты штрихов с использованием фильтров SOGD и нормализации ориентации. Proc IAPR Int Conf Pattern Recognin 2: 351–354.
    25. 25. Си-Цзянь Л., Джен-Цан Х. (2005) Методы повышения производительности для распознавания китайских иероглифов.Proc Int Conf Doc Anal Recognit 2: 710–714.
    26. 26. Rui C, Yan T, Yu-Hui Q (2006) Новая модель извлечения штрихов для китайских иероглифов на основе управляемых фильтров, IEEE Int Conf Cogn Inform. 1: 547–551.
    27. 27. Цзя З., Чжи-Цян Л. (2006)Сегментация штрихов китайских иероглифов с использованием марковских случайных полей. Распознавание шаблона внутренней конференции 1: 868–871.
    28. 28. Ченг-Лин Л. (2007) Извлечение градиента с помощью нормализации для распознавания рукописных символов.IEEE Trans Pattern Anal Mach Intell 29 (8): 1465–1469.
    29. 29. Нин В. (2008) Распознавание печатных китайских иероглифов на основе вероятности распределения пикселей изображения символа. Международная конференция IIHMSP: 1403–1407.
    30. 30. Jia Z, Wei F, Lei X, Zhi-Qiang L (2010) Каскадные марковские случайные поля для извлечения штрихов китайских иероглифов. Inf Sci 180 (2): 301–311.
    31. 31. LibSVM: библиотека для машины опорных векторов (2013 г.). Доступно: http://www.csie.ntu.edu.tw/~cjlin/libsvm/. По состоянию на 23 января 2013 г.
    .

Написать ответ

Ваш адрес email не будет опубликован.