<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="/resources/xsl/jats-html.xsl"?>
<article article-type="research-article" dtd-version="1.1" xml:lang="ko" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
	<journal-meta>
		<journal-id journal-id-type="publisher-id">jkits</journal-id>
		<journal-title-group>
		<journal-title>한국지식정보기술학회 논문지</journal-title>
		<journal-title xml:lang="en">Journal of Knowledge Information Technology and Systems</journal-title>
		</journal-title-group>
		<issn pub-type="ppub">1975-7700</issn>
		<publisher>
		<publisher-name>한국지식정보기술학회</publisher-name>
		<publisher-name xml:lang="en">Korea Knowledge Information Technology Society</publisher-name>
		</publisher>
	</journal-meta>
	<article-meta>
		<article-id pub-id-type="publisher-id">jkits_2019_14_04_411</article-id>
		<article-id pub-id-type="doi">10.34163/jkits.2019.14.4.010</article-id>
		<article-categories>
			<subj-group>
				<subject>Research Article</subject>
			</subj-group>
		</article-categories>
		<title-group>
			<article-title>평양 방언과 서울 표준어의 자음에 대한 음성신호 파라미터들의 비교연구 - 파찰음 “ㅈ/ㅉ/ㅊ”을 중심으로</article-title>
			<trans-title-group xml:lang="en">
				<trans-title>A Comparative Study of the Speech Signal Parameters for the Consonants of Pyongyang and Seoul Dialects - Focused on the affricates “ ㅈ/ㅉ/ㅊ”</trans-title>
			</trans-title-group>
		</title-group>
		<contrib-group>
			<contrib contrib-type="author" xlink:type="simple">
				<name-alternatives>
					<name name-style="eastern">
						<surname>유</surname><given-names>광복</given-names>
					</name>
					<name name-style="western" xml:lang="en">
						<surname>You</surname><given-names>Kwang-Bock</given-names>
					</name>
					</name-alternatives>
				<xref ref-type="aff" rid="A1"><sup>1</sup></xref>
			</contrib>
					<contrib contrib-type="author" xlink:type="simple">
				<name-alternatives>
					<name name-style="eastern">
						<surname>소</surname><given-names>신애</given-names>
					</name>
					<name name-style="western" xml:lang="en">
						<surname>So</surname><given-names>Shinae</given-names>
					</name>
					</name-alternatives>
				<xref ref-type="aff" rid="A2"><sup>2</sup></xref>
				</contrib>
				<contrib contrib-type="author" xlink:type="simple">
				<name-alternatives>
					<name name-style="eastern">
						<surname>이</surname><given-names>강희</given-names>
					</name>
					<name name-style="western" xml:lang="en">
						<surname>Lee</surname><given-names>Kang-Hee</given-names>
					</name>
					</name-alternatives>
				<xref ref-type="aff" rid="A3"><sup>3</sup></xref>
				<xref ref-type="fn" rid="fn001"><sup>*</sup></xref>
				</contrib>
			</contrib-group>
		<aff-alternatives id="A1">
			<aff><sup>1</sup><italic>숭실대학교 IT대학 전자정보공학부 부교수</italic></aff>
			<aff xml:lang="en"><italic>School of Electronic Engineering, Soongsil University</italic></aff>
		</aff-alternatives>
				<aff-alternatives id="A2">
			<aff><sup>2</sup><italic>숭실대학교 인문대학 국어국문학과 부교수</italic></aff>
			<aff xml:lang="en"><italic>Department of Korean Language and Literature, Soongsil University</italic></aff>
		</aff-alternatives>
				<aff-alternatives id="A3">
				<aff><sup>3</sup><italic>숭실대학교 IT대학 글로벌미디어학부 부교수</italic></aff>
			<aff xml:lang="en"><italic>Global School of Media, Soongsil University</italic></aff>
		</aff-alternatives>
				<author-notes>
			<fn id="fn001"><label>*</label><p>Corresponding author is with the Global School of Media, Soongsil University, 369 Sangdo-ro, Dongjak-gu Seoul, 06978, KOREA.</p>
			<p><italic>E-mail address</italic>: <email>kanghee.lee@ssu.ac.kr</email></p></fn>
		</author-notes>
		<pub-date pub-type="ppub">
			<month>8</month>
			<year>2019</year>
		</pub-date>
		<volume>14</volume>
		<issue>4</issue>
		<fpage>411</fpage>
		<lpage>423</lpage>
		<history>
			<date date-type="received">
				<day>9</day>
				<month>6</month>
				<year>2019</year>
			</date>
			<date date-type="rev-recd">
				<day>3</day>
				<month>8</month>
				<year>2019</year>
			</date>
			<date date-type="accepted">
				<day>9</day>
				<month>8</month>
				<year>2019</year>
			</date>
		</history>
		<permissions>
			<copyright-statement>&#x00A9; 2019 KKITS All rights reserved</copyright-statement>
			<copyright-year>2019</copyright-year>
		</permissions>
		<abstract>
			<title>요약</title>
			<p>본 논문은 공학적 응용인 음성신호처리의 관점에서 평양 지역어와 서울 표준어의 음가가 다른 파찰음 / ㅈ, ㅉ, ㅊ/을 비교 연구하였다. 서울 지역어에서는 경구개음으로 서북 지역어에서는 치경음으로 실현되는 이 자음들에 대해 스펙트럼, 피치, 포먼트 주파수 같은 음성 신호의 파라미터들을 추출 (측정)하여 이 두 지역의 이 자음들에 대한 음가의 차이를 신호처리적인 방법들로 비교 연구하였다. /ㅈ, ㅉ, ㅊ/의 자음에서 평양 지역이 서울 지역 보다 에너지의 응집도가 높았고, 포먼트 주파수의 분포가 잘 구분이 되는 것으로 확인 되었다. 본 논문은 대부분의 경우 음운론적 혹은 실험음성학적 방법들로 수행했던 평양 방언의 모음 혹 그 체계 연구에 더하여 음성신호처리의 파라미터들로서 자음 연구를 수행하는 연구 방법을 제시하였다. 본 논문에서는 언어학적 조사와 실험 음성학적 결과들을 신호처리의 공학적 방법으로 검증하는 새로운 연구 방법을 제시 하였다.</p>
		</abstract>
		<trans-abstract xml:lang="en">
			<title>ABSTRACT</title>
			<p>In this paper, from the point of view of speech signal processing as an engineering application, the comparative study of the Pyongyang and Seoul dialects is performed. In special, the affricates "ㅈ, ㅉ, ㅊ", which would have different phonetic values between Pyongyang and Seoul dialects, are focused and compared. For these consonants, the speech parameters such as the spectrogram, pitch, and Formant frequencies are extracted (measured) and the differences in their phonetic values of these two regions have been compared. It is confirmed that for these consonants, the Pyongyang dialects have higher energy cohesion than the Seoul dialects, and the distribution of Formant frequency was well distinguished. With the vowel study of Pyongyang dialect, which was carried out with phonological or experimental phonological methods, this paper presents the study of consonants in Pyongyang dialect by using the speech signal parameters. In this paper, a method is proposed for verifying linguistic investigations and experimental phonetic results by using signal processing.</p>
		</trans-abstract>
		<kwd-group kwd-group-type="author" xml:lang="en">
			<kwd>Affricates consonants</kwd>
			<kwd>Speech signal processing</kwd>
			<kwd>Pyongyang dialect</kwd>
			<kwd>Spectrogram</kwd>
			<kwd>formant frequencies</kwd>
			<kwd>Pitch</kwd>
		</kwd-group>
	</article-meta>
</front>
<body>
<sec id="sec001" sec-type="intro">
	<title>1. 서 론</title>
<p>음성신호에 대한 음운론적 연구 (phonological research)이든 언어학적 연구이든지 대부분 경우는 모음 (많은 경우 유성음) 혹은 모음의 체계에 관한 것이다. 음성신호처리라는 공학적 연구의 대부분도 모음 (유성음)인 것이 사실이다.</p>
<p>자음 (많은 경우 무성음)은 조음방법 (manner of articulation), 조음위치 (place of articulation), 그리고 position of vocal cords 등에 따라서 발음 혹은 그 소리 값을 설명할 수 있다. 그러나 모음은 혀(tongue), 입술 (lips), 그리고 턱 (jaw) 등의 3차원적 움직임에 더불어 vocal tract이 갖는 특성 등이 표현되는 것이라 할 수 있다. 이런 많은 변수들이 포함되는 모음의 조음 방식은 자음에 비해 상당히 이해하기 어려운 것이다. 모음은 언어와 언어 사이의 차이 그리고 같은 언어에서도 지역 간의 차이가 매우 크다고 한다. 언어의 진화에서도 자음은 상대적으로 안정적인 변화가 있지만 이에 비해 모음은 그 변화가 급격하고 매우 크다. 이런 이유들로 인해 모음에 관한 연구들이 상대적으로 활발한 것으로 보인다. 이런 경향들은 유성음 신호는 준주기적 특성을 갖고 있어 신호처리의 많은 수학적 개념들을 적용하기가 용이하기에 음성신호의 연구에서도 그러하다. 유성음에 일반적으로 적용되고 있는 음성신호 파라미터들에는 신호의 에너지, 피치,그리고 포먼트 주파수 등이 있다.그러나 무성음에 관한 연구는 유성음 연구에 비해 상대적으로 그 방법론 그리고 추출 파라미터들이 많지 않다고 할 수 있다. 만일 어떤 특정 자음들이 그 특성 혹은 소리 값이 지역에 따라서 상당한 차이를 나타낸다면 이에 대한 연구가 있어야 하는 것이 정상적일 것이다.</p>
<p>본 논문은 신호처리의 수학적 개념에 기초하여 한국어의 자음에 관한 비교 연구를 수행하였다. 언어학적 연구들도 기본적으로 검토를 하였다. 표준어 (서울 지역어)와 평양을 중심으로 한 서북지역 방언의 자음에서 그 소리 값에서 많은 차이를 보이는 파찰음을 중심으로 비교하였다.</p>
<p>표준어를 비롯한 남한 지역어의 경우에는 파찰음 /ㅈ, ㅊ, ㅉ/가 경구개음으로 실현되는 데 반해, 평안도, 함북 육진 지역, 황해도 일부 지역 등에서는 파찰음 /ㅈ, ㅊ, ㅉ/가 치음 내지 치조음으로 조음이 되고 있다. 즉, 파찰음의 조음 위치에 있어서 표준어와 평양 지역어가 큰 차이를 보이는 것이다. 대부분의 남한 지역어에서 폐쇄음 /ㄷ, ㅌ, ㄸ/나 비음 /ㄴ/가 치조음으로 조음되는 반면, 북한 지역어에서는 이들이 치음으로 조음되는 것이다. 이러한 음성적 차이들은 구개음화 및 ‘어두 ㄴ 탈락’과 같은 음운 현상의 차이로 나타나고 있다[<xref ref-type="bibr" rid="B001">1</xref>-<xref ref-type="bibr" rid="B003">3</xref>]. 이 파찰음에 관련하여 2010년대에 새터민들의 발음으로 확인한 연구가 있다<xref ref-type="bibr" rid="B004">[4]</xref>. 이 연구의 결과를 &lt;<xref ref-type="table" rid="t001">표 1</xref>&gt;로 정리하였다.</p>
<table-wrap id="t001">
<label>표 1.</label>
<caption>
<title>치경음 실현율</title>
<p>Table 1. Table for Alveolar pronunciation rate</p>
</caption>
<table frame="box" rules="all" width="100%">
<tbody>
<tr align="center">
<td></td>
<td colspan="4">치경음 실현율(%)</td>
</tr>
<tr align="center">
<td></td>
<td>전체</td>
<td>동북</td>
<td>서북</td>
<td>육진</td>
</tr>
<tr align="center">
<td>자다</td>
<td>17.9</td>
<td>17.4</td>
<td>33.3</td>
<td>10</td>
</tr>
<tr align="center">
<td>짜다</td>
<td>28.2</td>
<td>17.4</td>
<td>33.3</td>
<td>50</td>
</tr>
<tr align="center">
<td>차다</td>
<td>5.1</td>
<td>4.3</td>
<td>16.7</td>
<td>0</td>
</tr>
<tr align="center">
<td>지다</td>
<td>12.8</td>
<td>8.7</td>
<td>16.7</td>
<td>20</td>
</tr>
<tr align="center">
<td>찌다</td>
<td>17.9</td>
<td>8.7</td>
<td>33.3</td>
<td>30</td>
</tr>
<tr align="center">
<td>치다</td>
<td>17.9</td>
<td>21.7</td>
<td>0.0</td>
<td>20</td>
</tr>
</tbody>
</table>
</table-wrap>
<p>이 두 지역의 모음들에서도 몇 가지 차이가 있다. 모음 “ㅓ”의 음가가 다르다. 서울 지역어에서는 [ʌ] 발음인데, 평양 방언은 [ɔ]의 발음으로 입술이 더 둥글어지고 좁아진 형태에서의 발음이다.</p>
<p>이외에도 의 음가가 다른 “ㅡ” 것으로 조사되었는데,학자들에 따르면 이 발음은“ㅜ”에 흡수되었다고 한다. 따라서 평양 지역어의 모음체계가 현재 변화하고 있는 것이다. 이외에도 그 음조가 서로 다르지만 이 차이에 대한 연구들이 충분히 진행되고 있지 않은 것이다[<xref ref-type="bibr" rid="B001">1</xref>,<xref ref-type="bibr" rid="B004">4</xref>-<xref ref-type="bibr" rid="B010">10</xref>].</p>
<p>기존에 남북한 방언들의 모음에 관한 연구는 비교적 활발히 이루어져 온 반면, 이들의 자음에 관한 음성적 연구는 거의 이루어지지 못했다는 점에서, 남북한의 개별 방언의 자음 음성에 대한 본 논문의 중요성은 상당히 크다고 할 수 있다.</p>
<p>본 논문의 구성은 다음과 같다. 2장에서는 본 논문에서 추출하고 비교한 음성신호의 파라미터들에 관해 신호처리적인 분석에 대해 기술하였고, 3장에서는 시뮬레이션의 결과들을 분석 비교 하였다. 마지막으로 4장에서는 본 논문의 결과들과 그에 대한 검토를 하였다.</p>
</sec>
<sec id="sec002">
<title>2. 음성신호의 파라미터와 신호의 분석</title>
<p>본 논문은 평양지역 방언에서 /ㅅ, ㅆ/, /ㅈ, ㅊ, ㅉ/, /ㄷ, ㅌ, ㄸ/ 등의 자음 발음이 서울 지역어와 는 다르다는 점에 착안하여 연구를 진행하였다. 음운론적 관점에서 자음의 연구는 조음 방법과 조음위치에 따른 소리 값에 관심을 갖고 있다. 이런 음운론적 연구와 함께 실험음향적 연구가 더불어 수행되고 있다. 이런 실험음향적 연구에 대표적으로 사용되고 있는 프로그램으로 Computerized Speech Lab (CSL)과 Praat이 있다<xref ref-type="bibr" rid="B011">[11]</xref>. 이런 프로그램들은 음성신호처리 분야에서 일반적으로 사용하고 있는 알고리즘들을 채용하고 있다. 예를 들면, 포먼트 주파수들을 측정하기 위해서 Linear Prediction Coding (LPC) 알고리즘을 사용하였고, 알고리즘의 유연성을 위해서 LPC 방정식의 차수를 선택할 수 있도록 하고 있다. 그러나 음성신호처리 관점에서 보면 알고리즘은 꼭 하나일 필요는 없고 심지어 본 논문에서 시도한 것 같이 새로운 방법으로 측정할 수도 있다.그리고 이 방정식의 차수는10차 이상일 필요는 없다는 것이 일반적인 정설이다<xref ref-type="bibr" rid="B012">[12]</xref>. 실험음향적인 분석이 기존의 알고리즘만으로 혹은 제공된 tools들로 수행된다는 것은 신호처리의 공학적 접근에서 보면 제한적인 방법으로 측정된 데이터이기에 그 한계가 분명히 존재한다. 그러므로 이런 프로그램을 사용하기 위해서는 음성신호의 특성들을 표현하는 파라미터들의 속성들을 정확히 이해하고 실행해야 한다[<xref ref-type="bibr" rid="B012">12</xref>-<xref ref-type="bibr" rid="B015">15</xref>].</p>
<p>본 장에서는 이러한 한계들에 대해 신호처리의 기본 개념에 근거한 수학적인 모델링들을 분석한다. 이러한 분석을 통해서 음성신호에 적절한 파라미터들을 추출하였다. 본 논문은 이 파라미터들을 남북한 자음 음성 비교에 활용하였다.</p>
<sec id="sec002-1">
<title>2.1 자음 생성 모델의 분석</title>
<p>시간에 따라서 변하는 음성신호는 선형 시변 시스템으로 모델링하는 것이 타당하다. 그러나 충분히 짧은 프레임으로 신호를 처리하면 그 수학적 표현이 매우 간결해지는 선형 시불변 시스템으로 나타낼 수 있다<xref ref-type="bibr" rid="B014">[14]</xref>.</p>
<p><xref ref-type="fig" rid="f001">그림1</xref>은 무성음 생성 모델을 보인다.출력 음성신호, <italic>s</italic>[<italic>n</italic>],은 아래의 식으로 나타낸다.</p>
<disp-formula-group>
	<disp-formula id="dm01">
		<label>(1)</label>
<mml:math id="dm01-1"><mml:mi>s</mml:mi><mml:mfenced open="[" close="]"><mml:mi>n</mml:mi></mml:mfenced><mml:mo>=</mml:mo><mml:mi>G</mml:mi><mml:mo>&#xB7;</mml:mo><mml:mi>u</mml:mi><mml:mfenced open="[" close="]"><mml:mi>n</mml:mi></mml:mfenced><mml:mo>*</mml:mo><mml:mi>h</mml:mi><mml:mfenced open="[" close="]"><mml:mi>n</mml:mi></mml:mfenced></mml:math>
	</disp-formula>
</disp-formula-group>
<p>여기서 <italic>G</italic>는 무성음 구간 프레임의 이득 조정(Gain control) 값이고, <italic>u</italic>[<italic>n</italic>]은 랜덤 노이즈 여기신호이고, <italic>h</italic>[<italic>n</italic>]은 무성음의 성도 임펄스 응답 (vocal tract impulse response)이다. *는 신호들의 콘볼루션 (convolution) 계산을 나타낸다. &lt;<xref ref-type="fig" rid="f001">그림 1</xref>&gt;의 무성음 생성 모델에서 합성필터의 입력이 랜덤 신호이기에 무성음은 함수로 autocorrelation 표현할 수 있다.</p>
<disp-formula-group>
	<disp-formula id="dm02">
		<label>(2)</label>
<mml:math id="dm02-1"><mml:msub><mml:mi>&#x3D5;</mml:mi><mml:mrow><mml:mi>s</mml:mi><mml:mi>s</mml:mi></mml:mrow></mml:msub><mml:mfenced open="[" close="]"><mml:mi>n</mml:mi></mml:mfenced><mml:mo>=</mml:mo><mml:msup><mml:mi>G</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:msub><mml:mi>&#x3D5;</mml:mi><mml:mrow><mml:mi>v</mml:mi><mml:mi>v</mml:mi></mml:mrow></mml:msub><mml:mfenced open="[" close="]"><mml:mi>n</mml:mi></mml:mfenced><mml:mo>&#x2217;</mml:mo><mml:msub><mml:mi>&#x3D5;</mml:mi><mml:mrow><mml:mi>r</mml:mi><mml:mi>r</mml:mi></mml:mrow></mml:msub><mml:mfenced open="[" close="]"><mml:mi>n</mml:mi></mml:mfenced></mml:math>
	</disp-formula>
</disp-formula-group>
<fig id="f001" orientation="portrait" position="float">
	<label>그림 1.</label>
	<caption>
		<title>자음 (무성음) 생성 Model</title>
		<p>Figure 1. Unvoiced Production Model</p>
	</caption>
	<graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f001.jpg" position="float" orientation="portrait" xlink:type="simple"></graphic>
</fig>
<p><italic>ϕ</italic><sub><italic>vv</italic></sub>[<italic>n</italic>]과 <italic>Φ</italic><sub><italic>rr</italic></sub>[<italic>n</italic>]은 각각 성도와 입술에서의 autocorrelation 함수들이다. 그래서 autocorrelation 함수의 푸리에 변환인 power spectrum으로 무성음을 다음과 같이 표현할 수 있다[<xref ref-type="bibr" rid="B014">14</xref>,<xref ref-type="bibr" rid="B015">15</xref>].</p>
<disp-formula-group>
	<disp-formula id="dm03">
		<label>(3)</label>
<mml:math id="dm03-1"><mml:msub><mml:mi>&#x424;</mml:mi><mml:mrow><mml:mi>s</mml:mi><mml:mi>s</mml:mi></mml:mrow></mml:msub><mml:mfenced><mml:msup><mml:mi>e</mml:mi><mml:mrow><mml:mi>j</mml:mi><mml:mi>&#x3C9;</mml:mi></mml:mrow></mml:msup></mml:mfenced><mml:mo>=</mml:mo><mml:msup><mml:mi>G</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mo>&#xFF5C;</mml:mo><mml:mi>V</mml:mi><mml:mfenced><mml:msup><mml:mi>e</mml:mi><mml:mrow><mml:mi>j</mml:mi><mml:mi>&#x3C9;</mml:mi></mml:mrow></mml:msup></mml:mfenced><mml:mo>&#xFF5C;</mml:mo><mml:msup><mml:maction actiontype="argument"><mml:mrow/></mml:maction><mml:mn>2</mml:mn></mml:msup><mml:mo>&#xFF5C;</mml:mo><mml:mi>R</mml:mi><mml:mfenced><mml:msup><mml:mi>e</mml:mi><mml:mrow><mml:mi>j</mml:mi><mml:mi>&#x3C9;</mml:mi></mml:mrow></mml:msup></mml:mfenced><mml:mo>&#xFF5C;</mml:mo><mml:msup><mml:maction actiontype="argument"><mml:mrow/></mml:maction><mml:mn>2</mml:mn></mml:msup></mml:math>
	</disp-formula>
</disp-formula-group>
<p><xref ref-type="disp-formula" rid="dm03">식 3</xref>에서 알 수 있는 것 같이 무성음의 특성을 나타내는 파라미터로 power spectrum이 중요하다.</p>
<p>본 논문에서는 MatLab의 내장함수인 spectrogram function을 사용하였다. 이 함수는 음성신호가 시간에 따라서 변할 때 이에 대응하는 주파수 성분이 어떻게 분포하는지를 보여준다<xref ref-type="bibr" rid="B015">[15]</xref>.</p>
</sec>
<sec id="sec002-2">
<title>2.2 포먼트 주파수의 분석</title>
<p>음성신호의 주기적인 특성을 피치라고 하며 대부분의 경우 유성음에서 나타난다. 피치를 정확하게 측정하는 것은 매우 어려운 일이다. 이는 음성신호가 갖는 준주기적인 특성과 시간에 따라 변하는 통계적 특성에 기인한다.</p>
<p>피치를 추정하는 방법들에는 시간영역에서는 Autocorrelation Function (ACF) 알고리즘과 Average Magnitude Difference Function (AMDF) 알고리즘이 있고, 주파수 영역에서는 Cepstrum Function (CF) 알고리즘이 있다. 본 논문에서는 ACF 방법을 사용하여 피치를 추정하였다. 이에 대한 정의식은 아래와 같다[<xref ref-type="bibr" rid="B012">12</xref>,<xref ref-type="bibr" rid="B014">14</xref>].</p>
<disp-formula-group>
	<disp-formula id="dm04">
		<label>(4)</label>
<mml:math id="dm04-1"><mml:mi>R</mml:mi><mml:mfenced open="[" close="]"><mml:mi>m</mml:mi></mml:mfenced><mml:mo>=</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mi>N</mml:mi></mml:mfrac><mml:munderover><mml:mo>&#x2211;</mml:mo><mml:mrow><mml:mi>n</mml:mi><mml:mo>=</mml:mo><mml:mn>0</mml:mn></mml:mrow><mml:mrow><mml:mi>N</mml:mi><mml:mo>-</mml:mo><mml:mn>1</mml:mn><mml:mo>-</mml:mo><mml:mi>m</mml:mi></mml:mrow></mml:munderover><mml:mi>s</mml:mi><mml:mfenced open="[" close="]"><mml:mi>n</mml:mi></mml:mfenced><mml:mi>s</mml:mi><mml:mfenced open="[" close="]"><mml:mrow><mml:mi>n</mml:mi><mml:mo>+</mml:mo><mml:mi>m</mml:mi></mml:mrow></mml:mfenced></mml:math>
	</disp-formula>
</disp-formula-group>
<p>이 식에서 지연 (lag 혹은 delay)인 <italic>m</italic>의 범위는 0 ≤ <italic>m</italic> ≤<italic>M</italic><sub>0</sub>이다. 이 함수는 <italic>m</italic>＝0에서 최댓값을 갖는 우함수이다.</p>
<p>본 논문에서는 분석하려는 자음에 따르는 모음의 피치를 측정하였고 그것의 변화를 보았다.</p>
<fig id="f002" orientation="portrait" position="float">
	<label>그림 2.</label>
	<caption>
		<title>모음 (유성음) 생성 Model</title>
		<p>Figure 2. Voiced Production Model</p>
	</caption>
	<graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f002.jpg" position="float" orientation="portrait" xlink:type="simple"></graphic>
</fig>
<p>&lt;<xref ref-type="fig" rid="f002">그림 2</xref>&gt;는 유성음에 대한 Linear Prediction Coding 분석 모델을 보여준다. 이 모델에서 디지털 필터는 음성신호 생성에서 성도 특성을 나타내는 포먼트 주파수들을 추출할 수 있고, 이 필터의 전달함수는 All-pole rational function으로 아래의 식으로 표현한다.</p>
<disp-formula-group>
	<disp-formula id="dm05">
		<label>(5)</label>
<mml:math id="dm05-1"><mml:mi>H</mml:mi><mml:mfenced><mml:mi>z</mml:mi></mml:mfenced><mml:mo>=</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mrow><mml:mn>1</mml:mn><mml:mo>-</mml:mo><mml:mstyle displaystyle="true"><mml:munderover><mml:mo>&#x2211;</mml:mo><mml:mrow><mml:mi>k</mml:mi><mml:mo>=</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>p</mml:mi></mml:munderover></mml:mstyle><mml:msub><mml:mi>a</mml:mi><mml:mi>k</mml:mi></mml:msub><mml:msup><mml:mi>z</mml:mi><mml:mrow><mml:mo>-</mml:mo><mml:mi>k</mml:mi></mml:mrow></mml:msup></mml:mrow></mml:mfrac></mml:math>
	</disp-formula>
</disp-formula-group>
<p><xref ref-type="disp-formula" rid="dm05">식 5</xref>에서 예측계수 <italic>α</italic><sub><italic>k</italic></sub>들을 구하는 것은 포먼트 주파수를 추출한다는 것과 같은 의미가 된다.</p>
<p><xref ref-type="disp-formula" rid="dm05">식 5</xref>에서의 예측계수 <italic>α</italic><sub><italic>k</italic></sub>들은 다음과 같이 정의되는 <mml:math id="dm001"><mml:mi>e</mml:mi><mml:mfenced><mml:mi>n</mml:mi></mml:mfenced><mml:mo>=</mml:mo><mml:mi>s</mml:mi><mml:mover><mml:mfenced open="[" close="]"><mml:mi>n</mml:mi></mml:mfenced><mml:mo>^</mml:mo></mml:mover><mml:mo>-</mml:mo><mml:mi>s</mml:mi><mml:mfenced open="[" close="]"><mml:mi>n</mml:mi></mml:mfenced></mml:math> 오차를 최소화하는 값들이고, 이 계수들로 구성되는 다항식의 근들은 서로 켤레 복소수 관계이다. 본 논문에서는 이 계수들을 ACF를 기초한 Levinson-Durbin 알고리즘으로 구하였다<xref ref-type="bibr" rid="B012">[12]</xref><xref ref-type="bibr" rid="B014">[14]</xref><xref ref-type="bibr" rid="B015">[15]</xref>. 본 논문에서는 분석하는 자음에 따르는 모음의 포먼트 주파수를 측정하였다. 이 모음의 포먼트 주파수들은 서울 표준어와 평양 지역어에서 어떤 차이를 보이는지 비교하였다.</p>
</sec>
<sec id="sec002-3">
<title>2.3 유무성음 탐지 알고리즘</title>
<p>음성신호 처리의 연구 분야에서 고전적인 문제 중에 하나가 유무성음의 구간을 구별하는 문제이다. 이 문제의 어려움은 음성신호가 non-stationary이고 준주기적 (quasi-periodic)인 것에 기인하고 또 glottal excitation과 성도 사이의 상호작용에 근거한다. 그래도 음성신호에서 유성음과 무성음은 에너지에서 큰 차이를 보인다.이와 함께 신호가(+) 값에서 (-) 값으로 또 그 반대로 변하는 수를 Zero Crossing Rate (ZCR)이라 한다. ZCR은 유성음 구간이 랜덤 신호 같은 무성음 구간에 비해 적다. 아래의 <xref ref-type="disp-formula" rid="dm06">식 6</xref>으로 ZCR을 표현 할 수 있다<xref ref-type="bibr" rid="B014">[14]</xref>.</p>
<disp-formula-group>
	<disp-formula id="dm06">
		<label>(6)</label>
<mml:math id="dm06-1"><mml:mi>Z</mml:mi><mml:mi>C</mml:mi><mml:mi>R</mml:mi><mml:mfenced open="[" close="]"><mml:mi>m</mml:mi></mml:mfenced><mml:mo>=</mml:mo><mml:mfrac><mml:mn>1</mml:mn><mml:mn>2</mml:mn></mml:mfrac><mml:munderover><mml:mo>&#x2211;</mml:mo><mml:mrow><mml:mi>n</mml:mi><mml:mo>=</mml:mo><mml:mi>m</mml:mi><mml:mo>-</mml:mo><mml:mi>N</mml:mi><mml:mo>+</mml:mo><mml:mn>1</mml:mn></mml:mrow><mml:mi>m</mml:mi></mml:munderover><mml:mo>&#xFF5C;</mml:mo><mml:mi>s</mml:mi><mml:mi>g</mml:mi><mml:mi>n</mml:mi><mml:mfenced><mml:mrow><mml:mi>s</mml:mi><mml:mfenced open="[" close="]"><mml:mi>n</mml:mi></mml:mfenced></mml:mrow></mml:mfenced><mml:mo>-</mml:mo><mml:mi>s</mml:mi><mml:mi>g</mml:mi><mml:mi>n</mml:mi><mml:mfenced><mml:mrow><mml:mi>s</mml:mi><mml:mfenced open="[" close="]"><mml:mrow><mml:mi>n</mml:mi><mml:mo>-</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:mfenced></mml:mrow></mml:mfenced><mml:mo>&#xFF5C;</mml:mo></mml:math>
	</disp-formula>
</disp-formula-group>
<p>여기서 <italic>m</italic>은 프레임을 나타내고 <italic>sgn</italic>(.) 함수는 인수의 부호에 따라 +1 혹은 -1의 값을 돌려준다. 일반적으로 <xref ref-type="disp-formula" rid="dm07">식7</xref>과 같이 신호의 에너지를 구한다. 실제적으로는 프레임 별로 에너지를 구하는 것이므로 windowing을 하여 계산하게 된다[<xref ref-type="bibr" rid="B014">14</xref>,<xref ref-type="bibr" rid="B015">15</xref>].</p>
<disp-formula-group>
	<disp-formula id="dm07">
		<label>(7)</label>
<mml:math id="dm07-1"><mml:mi>E</mml:mi><mml:mo>=</mml:mo><mml:munderover><mml:mo>&#x2211;</mml:mo><mml:mrow><mml:mi>m</mml:mi><mml:mo>=</mml:mo><mml:mo>-</mml:mo><mml:mo>&#x221E;</mml:mo></mml:mrow><mml:mo>&#x221E;</mml:mo></mml:munderover><mml:msup><mml:mi>s</mml:mi><mml:mn>2</mml:mn></mml:msup><mml:mfenced open="[" close="]"><mml:mi>m</mml:mi></mml:mfenced></mml:math>
	</disp-formula>
</disp-formula-group>
<p>본 논문은 위의 두 <xref ref-type="disp-formula" rid="dm06">식 6</xref>과 <xref ref-type="disp-formula" rid="dm07">7</xref>을 사용하여 유무성음을 구분하는 알고리즘을 구현하였다. 각 프레임의 ZCR 값으로 3개의 영역으로 나눈다. 먼저, ZCR 값이 최댓값의 50%보다 작으면 유성음 프레임으로 하고 산술값 “-1”을 부여한다. 두 번째는 50 ~ 67%이면 천이 구간으로 처리하고 그 값은 “0”으로 한다. 마지막으로 67% 이상이면 그 값을 “+1”로 하고 무성음 프레임으로 처리한다. 각 프레임의 에너지 값들을 비교하여 프레임에 대한 판단을 수행한다<xref ref-type="bibr" rid="B012">[12]</xref>. 본 알고리즘은 경구개음에 좋은 성능을 보여준다. 향후 본 알고리즘은 음성신호의 다른 파라미터들을 포함하는 새로운 알고리즘으로 그 성능을 높이는 일을 해야 한다.</p>
</sec>
</sec>
<sec id="sec003" sec-type="results">
<title>3. 시뮬레이션 결과</title>
<p>본 논문에서는 2010년에 수집된 평양 지역어로 노년층 화자들의 음성 자료를 같은 시기에 조사된 서울 지역어 노년층 화자들의 음성 자료와 비교하였다. 본 데이터는 언어 이주 상황에서 수집된 것이기에 현 평양 지역의 화자들보다는 더 보수적인 발화 상태를 유지하는 것으로 볼 수 있다. 사실상 북한 지역어 음성 자료를 수집하는 데에는 현실적인 제약이 따른다[<xref ref-type="bibr" rid="B001">1</xref>-<xref ref-type="bibr" rid="B003">3</xref>].</p>
<p>&lt;<xref ref-type="table" rid="t002">표 2</xref>&gt;에서 시뮬레이션에 사용한 음성 데이터를 지역과 조음방법으로 분류하였다. 각 음성 데이터는 16 kHz로 샘플링 하였다. 분석 프레임의 길이는 충분히 짧아서 본 논문에서 분석한 식들을 사용하기에 문제가 없는 샘플 으로 480 (30ms) 하였다.</p>
<table-wrap id="t002">
<label>표 2.</label>
<caption>
<title>비교 음성 Data (ㅈ/ㅉ/ㅊ) 분류표</title>
<p>Table 2. Classification table for Comparative speech Data (ㅈ/ㅉ/ㅊ)</p>
</caption>
<table frame="box" rules="all" width="100%">
<tbody>
<tr align="center">
<td rowspan="2" valign="middle">지역</td>
<td rowspan="2" valign="middle">분류</td>
<td rowspan="2" valign="middle">자음</td>
<td colspan="5">모음</td>
</tr>
<tr align="center">
<td>아</td>
<td>에</td>
<td>이</td>
<td>어/오</td>
<td>애</td>
</tr>
<tr align="center">
<td rowspan="3" valign="middle">서울</td>
<td rowspan="3" valign="middle">경구개음</td>
<td>ㅈ</td>
<td>잠을 자다</td>
<td></td>
<td>짐승 말</td>
<td>저 달</td>
<td>재다</td>
</tr>
<tr align="center">
<td>ㅉ</td>
<td>소금은 짜다</td>
<td></td>
<td>살이 찌다</td>
<td></td>
<td>째다</td>
</tr>
<tr align="center">
<td>ㅊ</td>
<td>차다</td>
<td>인체 간</td>
<td></td>
<td></td>
<td>채다</td>
</tr>
<tr align="center">
<td rowspan="3" valign="middle">평양</td>
<td rowspan="3" valign="middle">치조음</td>
<td>ㅈ</td>
<td>잠을 자다</td>
<td></td>
<td>짐승 말</td>
<td>저 달</td>
<td>재다</td>
</tr>
<tr align="center">
<td>ㅉ</td>
<td>소금은 짜다</td>
<td></td>
<td>살이 찌다</td>
<td></td>
<td>째다</td>
</tr>
<tr align="center">
<td>ㅊ</td>
<td>차다</td>
<td>인체 간</td>
<td></td>
<td></td>
<td>채다</td>
</tr>
</tbody>
</table>
</table-wrap>
<p>본 시뮬레이션은 랜덤 신호를 처리하는 것이기에 각 음성신호를 표준화 (normalization)하였다. 이는 시뮬레이션의 속도를 높일 수 있고 또 locally optimal 되는 것을 방지할 수 있다. 신호들의 평균(Mean)과 분산 (Variance)을 사용하여 표준화를 하였기에 음성신호가 갖고 있는 그 특성들이 그대로 나타날 수 있도록 하였다. 이와 더불어 <xref ref-type="disp-formula" rid="dm08">식 8</xref>로 나타낸 High-Pass Filter (HPF)로 불필요한 신호의 저주파 성분들을 제거하였다[<xref ref-type="bibr" rid="B002">2</xref>,<xref ref-type="bibr" rid="B003">3</xref>].</p>
<disp-formula-group>
	<disp-formula id="dm08">
		<label>(8)</label>
<mml:math id="dm08-1"><mml:mi>H</mml:mi><mml:mfenced><mml:mi>z</mml:mi></mml:mfenced><mml:mo>=</mml:mo><mml:mfrac><mml:mrow><mml:mn>0</mml:mn><mml:mo>.</mml:mo><mml:mn>946</mml:mn><mml:mo>-</mml:mo><mml:mn>1</mml:mn><mml:mo>.</mml:mo><mml:msup><mml:mrow><mml:mn>892</mml:mn><mml:mi>z</mml:mi></mml:mrow><mml:mrow><mml:mo>-</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msup><mml:mo>+</mml:mo><mml:mn>0</mml:mn><mml:mo>.</mml:mo><mml:msup><mml:mrow><mml:mn>946</mml:mn><mml:mi>z</mml:mi></mml:mrow><mml:mrow><mml:mo>-</mml:mo><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:mrow><mml:mrow><mml:mn>1</mml:mn><mml:mo>-</mml:mo><mml:mn>1</mml:mn><mml:mo>.</mml:mo><mml:msup><mml:mrow><mml:mn>889033</mml:mn><mml:mi>z</mml:mi></mml:mrow><mml:mrow><mml:mo>-</mml:mo><mml:mn>1</mml:mn></mml:mrow></mml:msup><mml:mo>+</mml:mo><mml:mn>0</mml:mn><mml:mo>.</mml:mo><mml:msup><mml:mrow><mml:mn>8948743</mml:mn><mml:mi>z</mml:mi></mml:mrow><mml:mrow><mml:mo>-</mml:mo><mml:mn>2</mml:mn></mml:mrow></mml:msup></mml:mrow></mml:mfrac></mml:math>
	</disp-formula>
</disp-formula-group>
<p>각 데이터의 그림들에서 “P”는 평양 지역 방언을, “S”는 서울 표준어를 나타낸다. 예시로 “P-kimky1jaeda.wav”는 평양 방언 “재다”를 화자 “kimky1”가 1차로 발화한 데이터임을 나타낸다<xref ref-type="bibr" rid="B001">[1]</xref>.</p>
<p>&lt;<xref ref-type="fig" rid="f003">그림 3</xref>&gt;은 자음 “ㅈ”(단어 “재다”에서)에 대한 스펙트럼을 보였다.이 스펙트럼은 <xref ref-type="disp-formula" rid="dm03">식3</xref>으로 계산된다.첫 번째 행은 단어“재다”의 파형이고,두개의 막대사이에 있는 부분이“재”이고, 두 번째 행에서 “ㅈ(진한 회색) +ㅐ(검은 색)”으로 무성음과 유성음으로 분리하였다. 세 번째 행에서는 이에 대한 스펙트럼을 보였다.</p>
<p>왼쪽 스펙트럼 (평양 지역어)의 앞부분 약 0.125(sec)와 이후를 비교해보면 확실하게 “ㅈ+ㅐ”로 구분되는 것을 알 수 있다. 이 평양 지역어의 “ㅈ”은 주파수가 4 ~ 8 kHz 사이에 많은 에너지 모여 있다.반면에 서울 표준어의 “ㅈ”은 0.075(sec)에서 주파수가 3 ~ 6 kHz 사이에 있음을 알수 있다.더불어 서울 표준어의 발화 속도가0.14(sec) 정도 빠르다고 할 수 있다.</p>
<p>&lt;<xref ref-type="fig" rid="f004">그림 4</xref>&gt;는 단어 “재다”에서 <xref ref-type="disp-formula" rid="dm06">식 6</xref>을 적용하여 Zero Crossing Rate (ZCR)을 구하고 이를 유무성음 구간을 탐지하는 것을 보였다. 먼저, 첫 번째 행에서 ZCR의 변화를 프레임별로 보였고, 다음 행에서 천이 구간을 제거하였다. 이 결과를 이용해서 유무성음을 구분 한 결과를 세 번째 행에서 보였다. 마지막 행에서는 <xref ref-type="disp-formula" rid="dm04">식 4</xref>로 ACF를 구해서 피치를 측정하고 이의 프레임별 변화를 보였다.</p>
<p>&lt;<xref ref-type="table" rid="t003">표 3</xref>, <xref ref-type="table" rid="t004">4</xref>, <xref ref-type="table" rid="t005">5</xref>&gt;에서는 본 논문에서 시뮬레이션을 수행한 파찰음 /ㅈ, ㅉ, ㅊ/의 모음에 대한 포먼트 주파수들의 값을 구하고 서울 표준어와 평양 방언과의 그 차이를 보였다.포먼트 주파수는 <xref ref-type="disp-formula" rid="dm05">식5</xref>에서의 전달함수 <italic>H</italic>(<sub><italic>z</italic></sub>)의 poles (극점)가 된다.</p>
<p>같은 방식으로 &lt;<xref ref-type="fig" rid="f005">그림 5</xref>&gt;와 &lt;<xref ref-type="fig" rid="f006">그림 6</xref>&gt;은 단어 “째다”의 분석을 보이고 있으며, &lt;<xref ref-type="fig" rid="f007">그림 7</xref>&gt;과 &lt;<xref ref-type="fig" rid="f008">그림 8</xref>&gt;은 단어 “채다”에 대해서 분석하였다.</p>
</sec>
<sec id="sec004" sec-type="Conclusions">
<title>4. 결 론</title>
<p>평양 지역어의 자음 /ㅈ/이 서울 표준어보다 에너지 응집도가 좋다 새터민의 발음으로 북한 . 지역들의 치경음 실현율을 조사한 &lt;<xref ref-type="table" rid="t001">표 1</xref>&gt;의 결과와 같이 유사하게 /ㅉ/에서 더 다름이 확인된다. 파찰음 /ㅈ, ㅉ, ㅊ/에서 서울 표준어와 평양 지역어는 <xref ref-type="table" rid="t003">표 3</xref>, <xref ref-type="table" rid="t004">4</xref>, <xref ref-type="table" rid="t005">5</xref>에서 보이는 것 같이 포먼트 주파수들의 차이에서 다른 특성을 보이고 있다. 그러나 피치의 변화는 개인차가 많은 것으로 보여서 이 부분은 더 많은 데이터로 조사해 볼 필요가 있다.</p>
<p>포먼트 주파수의 f1과 f2의 분포로 보면 /ㅉ, ㅊ/이 /ㅈ/ 보다 상대적으로 서울 표준어와 평양 방언을 잘 구분이 되고 있다. 선형적 함수로 이 분포를 분류하는 것이 가능해서 support vector machine과 같은 간단한 인공 지능 알고리즘의 적용이 용이할 것으로 보인다. 이런 결과는 &lt;<xref ref-type="table" rid="t003">표 3</xref>, <xref ref-type="table" rid="t004">4</xref>, <xref ref-type="table" rid="t005">5</xref>&gt;에서 확인 할 수 있다. 그러나 /ㅈ/은 실험 결과 /ㅉ, ㅊ/과 다르게 그 분포의 구분이 선형적이지 못하다.</p>
<p>이 부분은 향후 더 많은 데이터로 확인이 필요하다. <xref ref-type="disp-formula" rid="dm05">식 5</xref>로 표현한 합성 필터의 극점들은 서로 켤레 복소수라는 성질을 이용하여 이 필터를 2차의 다항식으로 표현되는 필터들로 분리하였다. 분리된 각 필터에서 이에 대응하는 포먼트 주파수를 구하여 &lt;<xref ref-type="table" rid="t003">표 3</xref>, <xref ref-type="table" rid="t004">4</xref>, <xref ref-type="table" rid="t005">5</xref>&gt;를 완성하였다.</p>
<p>본 논문에서 사용한 유무성음 영역 탐지 알고리즘은 ZCR과 에너지의 간단한 구성이기에 많은 천이 영역이 있을 것으로 예상하였으나 성공적으로 유무성음을 분리하였다. 그래서 본 알고리즘은 파찰음 /ㅈ, ㅉ, ㅊ/의 유무성음 영역 탐지에 잘 적용됨을 알 수 있다. 이외의 다른 한국어의 자음들에도 적용이 가능한지는 많은 데이터와 실험을 수행해볼 필요가 있다.</p>
<p>본 논문은 한국어 방언 연구에서 비교적 소홀했던 자음의 연구에 새로운 방법을 제시하였다. 또 언어학적인 조사와 실험 음성학적 결과들에 신호 처리의 공학적 방법을 더하여 그 결과들을 응용할 수 있도록 음성처리의 새로운 연구 방법을 제시하였다.</p>
<fig id="f003" orientation="portrait" position="float">
	<label>그림 3.</label>
	<caption>
		<title>자음 “ㅈ” (재다)에 대한 스펙트럼의 비교</title>
		<p>Figure 3. Comparison spectrum of the consonant “ㅈ” (재다)</p>
	</caption>
	<graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f003.jpg" position="float" orientation="portrait" xlink:type="simple"></graphic>
</fig>
<fig id="f004" orientation="portrait" position="float">
	<label>그림 4.</label>
	<caption>
		<title>“재” (재다)에서 유무성음 탐지 비교</title>
		<p>Figure 4. Comparison UV/V Detection in the word “재” (재다)</p>
	</caption>
	<graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f004.jpg" position="float" orientation="portrait" xlink:type="simple"></graphic>
</fig>
<table-wrap id="t003">
<label>표 3.</label>
<caption>
<title>자음 “ㅈ”에 관련하여 포먼트 주파수의 비교</title>
<p>Table 3. Comparison table of the Formant frequencies regarding to the consonant “ㅈ”</p>
</caption>
<table frame="box" rules="all" width="100%">
<tbody>
<tr align="center">
<td>Data</td>
<td colspan="3">재다</td>
<td colspan="3">잠을 자다</td>
<td colspan="3">짐승 말</td>
</tr>
<tr align="center">
<td>Formant</td>
<td>서울</td>
<td>평양</td>
<td>Difference</td>
<td>서울</td>
<td>평양</td>
<td>Difference</td>
<td>서울</td>
<td>평양</td>
<td>Difference</td>
</tr>
<tr align="center">
<td>F1</td>
<td>281</td>
<td></td>
<td></td>
<td>218</td>
<td>578</td>
<td>360</td>
<td>218</td>
<td>203</td>
<td>15</td>
</tr>
<tr align="center">
<td>F2</td>
<td>2000</td>
<td></td>
<td></td>
<td></td>
<td></td>
<td></td>
<td></td>
<td>1344</td>
<td></td>
</tr>
<tr align="center">
<td>F3</td>
<td>3234</td>
<td>2422</td>
<td>812</td>
<td></td>
<td>3094</td>
<td></td>
<td>2969</td>
<td>3703</td>
<td>734</td>
</tr>
<tr align="center">
<td>F4</td>
<td>5469</td>
<td>3500</td>
<td>1969</td>
<td>4625</td>
<td>5203</td>
<td>578</td>
<td></td>
<td>5422</td>
<td></td>
</tr>
<tr align="center">
<td>F5</td>
<td></td>
<td>5875</td>
<td></td>
<td></td>
<td>6359</td>
<td></td>
<td></td>
<td></td>
<td></td>
</tr>
</tbody>
</table>
</table-wrap>
<table-wrap id="t004">
<label>표 4.</label>
<caption>
<title>자음 “ㅉ”에 관련하여 포먼트 주파수의 비교</title>
<p>Table 4. Comparison table of the Formant frequencies regarding to the consonant “ㅉ”</p>
</caption>
<table frame="box" rules="all" width="100%">
<tbody>
<tr align="center">
<td>Data</td>
<td colspan="3">살이 찌다</td>
<td colspan="3">소금은 짜다</td>
<td colspan="3">째다</td>
</tr>
<tr align="center">
<td>Formant</td>
<td>서울</td>
<td>평양</td>
<td>Difference</td>
<td>서울</td>
<td>평양</td>
<td>Difference</td>
<td>서울</td>
<td>평양</td>
<td>Difference</td>
</tr>
<tr align="center">
<td>F1</td>
<td>125</td>
<td>218</td>
<td>93</td>
<td>187</td>
<td>625</td>
<td>438</td>
<td>265</td>
<td>281</td>
<td>16</td>
</tr>
<tr align="center">
<td>F2</td>
<td>1922</td>
<td>1766</td>
<td>156</td>
<td></td>
<td></td>
<td></td>
<td>2016</td>
<td>2234</td>
<td>218</td>
</tr>
<tr align="center">
<td>F3</td>
<td>3828</td>
<td>3766</td>
<td>62</td>
<td></td>
<td>3234</td>
<td></td>
<td></td>
<td></td>
<td></td>
</tr>
<tr align="center">
<td>F4</td>
<td>5477</td>
<td>5406</td>
<td>71</td>
<td>5688</td>
<td></td>
<td></td>
<td>5922</td>
<td>4515</td>
<td>1407</td>
</tr>
<tr align="center">
<td>F5</td>
<td></td>
<td></td>
<td></td>
<td></td>
<td>6266</td>
<td></td>
<td></td>
<td>6531</td>
<td></td>
</tr>
</tbody>
</table>
</table-wrap>
<table-wrap id="t005">
	<label>표 5.</label>
	<caption>
		<title>자음 “ㅊ”에 관련하여 포먼트 주파수의 비교</title>
	<p>Table 5. Comparison table of the Formant frequencies regarding to the consonant “ㅊ”</p>
	</caption>
	<table frame="box" rules="all" width="100%">
	<tbody>
		<tr align="center">
<td>Data</td>
<td colspan="3">차다</td>
<td colspan="3">채다</td>
<td colspan="3">인체 간</td>
</tr>
<tr align="center">
<td>Formant</td>
<td>서울</td>
<td>평양</td>
<td>Difference</td>
<td>서울</td>
<td>평양</td>
<td>Difference</td>
<td>서울</td>
<td>평양</td>
<td>Difference</td>
</tr>
<tr align="center">
<td>F1</td>
<td>344</td>
<td>1047</td>
<td>703</td>
<td>299</td>
<td>344</td>
<td>45</td>
<td>328</td>
<td>187</td>
<td>141</td>
</tr>
<tr align="center">
<td>F2</td>
<td></td>
<td>1859</td>
<td></td>
<td>2094</td>
<td></td>
<td></td>
<td></td>
<td>2266</td>
<td></td>
</tr>
<tr align="center">
<td>F3</td>
<td>3640</td>
<td></td>
<td></td>
<td>2828</td>
<td>3234</td>
<td>406</td>
<td>3109</td>
<td>3500</td>
<td>391</td>
</tr>
<tr align="center">
<td>F4</td>
<td></td>
<td>4766</td>
<td></td>
<td></td>
<td>5000</td>
<td></td>
<td>5219</td>
<td>5578</td>
<td>359</td>
</tr>
<tr align="center">
<td>F5</td>
<td>6688</td>
<td>6422</td>
<td>266</td>
<td>6656</td>
<td>6922</td>
<td>266</td>
<td></td>
<td>6844</td>
<td></td>
</tr>
	</tbody>
	</table>
</table-wrap>
<fig id="f005" orientation="portrait" position="float">
	<label>그림 5.</label>
	<caption>
		<title>자음 “ㅉ” (째다)에 대한 스펙트럼의 비교</title>
		<p>Figure 5. Comparison spectrum of the consonant “ㅉ” (째다)</p>
	</caption>
	<graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f005.jpg" position="float" orientation="portrait" xlink:type="simple"></graphic>
</fig>
<fig id="f006" orientation="portrait" position="float">
	<label>그림 6.</label>
	<caption>
		<title>“째” (째다)에 대한 유무성음 탐지 비교</title>
		<p>Figure 6. Comparison UV/V Detection in the word “째” (째다)</p>
	</caption>
	<graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f006.jpg" position="float" orientation="portrait" xlink:type="simple"></graphic>
</fig>
<fig id="f007" orientation="portrait" position="float">
	<label>그림 7.</label>
	<caption>
		<title>자음 “ㅊ” (채다)에 대한 스펙트럼의 비교</title>
		<p>Figure 7. Comparison spectrum of the consonant “ㅊ” (채다)</p>
	</caption>
	<graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f007.jpg" position="float" orientation="portrait" xlink:type="simple"></graphic>
</fig>
<fig id="f008" orientation="portrait" position="float">
	<label>그림 8.</label>
	<caption>
		<title>“ㅊ” (채다)에서 유무성음 탐지 비교</title>
		<p>Figure 8. Comparison UV/V Detection in the word “ㅊ” (채다)</p>
	</caption>
	<graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f008.jpg" position="float" orientation="portrait" xlink:type="simple"></graphic>
</fig>
</sec>
</body>
<back>
<ref-list>
<title>References</title>
<!-- [1] S-A. So, Experimental phonetic study on the Pyeong'an dialect: focusing on the vowels of the Pyeong'yang subdialect, Journal of Korean Linguistics, The Society of Korean Linguistics, 58, pp. 231-254, 2010.-->
<ref id="B001">
<label>[1]</label>
<element-citation publication-type="journal">
<person-group>
<name><surname>So</surname><given-names>S-A.</given-names></name>
</person-group>
<year>2010</year>
<article-title>Experimental phonetic study on the Pyeong'an dialect: focusing on the vowels of the Pyeong'yang subdialect</article-title>
<source>Journal of Korean Linguistics</source>
<publisher-name>The Society of Korean Linguistics</publisher-name>
<volume>58</volume>
<fpage>231</fpage><lpage>254</lpage>
<pub-id pub-id-type="doi">10.15811/jkl.2010..58.008</pub-id>
</element-citation>
</ref>
<!-- [2] K-H. Lee, S-A. So, and K-B. You, Annual report for the project - A study on extracting speech parameters for intonational and consonantal differences between the standard dialect (Seoul dialect) and the other dialects of Korean, 2018.-->
<ref id="B002">
<label>[2]</label>
<element-citation publication-type="report">
<person-group>
<name><surname>Lee</surname><given-names>K-H.</given-names></name>
<name><surname>So</surname><given-names>S-A.</given-names></name>
<name><surname>You</surname><given-names>K-B.</given-names></name>
</person-group>
<year>2018</year>
<source>Annual report for the project - A study on extracting speech parameters for intonational and consonantal differences between the standard dialect (Seoul dialect) and the other dialects of Korean</source>
</element-citation>
</ref>
<!-- [3] S-A. So, K-H. Lee, K-B. You, and H-Y. Lim, A comparative study of the speech signal parameters for the consonants of Pyongyang and Seoul dialects - focused on “ㅅ/ㅆ”, Journal of Multimedia Services Convergent with Art, Humanities, and Sociology, Vol. 8, pp. 927-937, 2018.-->
<ref id="B003">
<label>[3]</label>
<element-citation publication-type="journal">
<person-group>
<name><surname>So</surname><given-names>S-A.</given-names></name>
<name><surname>Lee</surname><given-names>K-H.</given-names></name>
<name><surname>You</surname><given-names>K-B.</given-names></name>
<name><surname>Lim</surname><given-names>H-Y.</given-names></name>
</person-group>
<year>2018</year>
<article-title>A comparative study of the speech signal parameters for the consonants of Pyongyang and Seoul dialects - focused on “ㅅ/ㅆ”</article-title>
<source>Journal of Multimedia Services Convergent with Art, Humanities, and Sociology</source>
<volume>8</volume>
<fpage>927</fpage><lpage>937</lpage>
</element-citation>
</ref>
<!-- [4] H-Y. Lee, Report the result of pronunciation education for the north Korean refugee, National Institute of Korean Language, Seoul, 2009.-->
<ref id="B004">
<label>[4]</label>
<element-citation publication-type="report">
<person-group>
<name><surname>Lee</surname><given-names>H-Y.</given-names></name>
</person-group>
<year>2009</year>
<source>Report the result of pronunciation education for the north Korean refugee</source>
<publisher-loc>Seoul</publisher-loc>
<publisher-name>National Institute of Korean Language</publisher-name>
</element-citation>
</ref>
<!-- [5] https://ko.wikipedia.org/wiki, Apr. 2019.-->
<ref id="B005">
<label>[5]</label>
<element-citation publication-type="webpage" publication-format="web">
<year>2019</year>
<month>Apr.</month>
<source><uri>https://ko.wikipedia.org/wiki</uri></source>
</element-citation>
</ref>
<!-- [6] https://namu.wiki/w/, Apr. 2019.-->
<ref id="B006">
<label>[6]</label>
<element-citation publication-type="webpage" publication-format="web">
<year>2019</year>
<month>Apr.</month>
<source><uri>https://namu.wiki/w/</uri></source>
</element-citation>
</ref>
<!-- [7] H-S. Jung, S-K. Yang, and B-S. Kang, Standard language education textbook for the north Korean refugee, National Institute of Korean Language, Seoul, 2011.-->
<ref id="B007">
<label>[7]</label>
<element-citation publication-type="book">
<person-group>
<name><surname>Jung</surname><given-names>H-S.</given-names></name>
<name><surname>Yang</surname><given-names>S-K.</given-names></name>
<name><surname>Kang</surname><given-names>B-S.</given-names></name>
</person-group>
<year>2011</year>
<article-title></article-title>
<source>Standard language education textbook for the north Korean refugee</source>
<publisher-loc>Seoul</publisher-loc>
<publisher-name>National Institute of Korean Language</publisher-name>
</element-citation>
</ref>
<!-- [8] S-K. Kahng, The hypercorrection of vowel /u/→ /i/ in north Korean dialects, Speech Science, The Korean Association of Speech Sciences, Vol. 6, No. 1, pp. 43-54, 1999.-->
<ref id="B008">
<label>[8]</label>
<element-citation publication-type="journal">
<person-group>
<name><surname>Kahng</surname><given-names>S-K.</given-names></name>
</person-group>
<year>1999</year>
<article-title>The hypercorrection of vowel /u/→ /i/ in north Korean dialects, Speech Science</article-title>
<source>The Korean Association of Speech Sciences</source>
<volume>6</volume><issue>1</issue>
<fpage>43</fpage><lpage>54</lpage>
</element-citation>
</ref>
<!-- [9] Y. B. Kim, About the consonants of Pyongan dialect, The Korean Language and Literature, 76, pp. 112-120, 1977.-->
<ref id="B009">
<label>[9]</label>
<element-citation publication-type="journal">
<person-group>
<name><surname>Kim</surname><given-names>Y. B.</given-names></name>
</person-group>
<year>1977</year>
<article-title>About the consonants of Pyongan dialect</article-title>
<source>The Korean Language and Literature</source>
<volume>76</volume>
<fpage>112</fpage><lpage>120</lpage>
</element-citation>
</ref>
<!-- [10] S-K. Kahng, The merger of back vowels in north Korean, Speech Sciences, The Korean Association of Speech Sciences, Vol. 5, No. 2, pp. 41-55, 1999.-->
<ref id="B010">
<label>[10]</label>
<element-citation publication-type="journal">
<person-group>
<name><surname>Kahng</surname><given-names>S-K.</given-names></name>
</person-group>
<year>1999</year>
<article-title>The merger of back vowels in north Korean, Speech Sciences</article-title>
<source>The Korean Association of Speech Sciences</source>
<volume>5</volume><issue>2</issue>
<fpage>41</fpage><lpage>55</lpage>
</element-citation>
</ref>
<!-- [11] B. G. Yang, Theory and practice of speech analysis using Pratt, Mansu Publishing Co., Seoul, 2010.-->
<ref id="B011">
<label>[11]</label>
<element-citation publication-type="book">
<person-group>
<name><surname>Yang</surname><given-names>B. G.</given-names></name>
</person-group>
<year>2010</year>
<source>Theory and practice of speech analysis using Pratt</source>
<publisher-loc>Seoul</publisher-loc>
<publisher-name>Mansu Publishing Co.</publisher-name>
</element-citation>
</ref>
<!-- [12] K-B. You, K-H. Lee, S-A. So, H-Y. Lim, and J. Park, A study of peak finding algorithms for the autocorrelation function of speech signal, Jounal of The Korea Society of Computer and Information, Vol. 21, No. 12, pp. 131-137, 2016.-->
<ref id="B012">
<label>[12]</label>
<element-citation publication-type="journal">
<person-group>
<name><surname>You</surname><given-names>K-B.</given-names></name>
<name><surname>Lee</surname><given-names>K-H.</given-names></name>
<name><surname>So</surname><given-names>S-A.</given-names></name>
<name><surname>Lim</surname><given-names>H-Y.</given-names></name>
<name><surname>Park</surname><given-names>J.</given-names></name>
</person-group>
<year>2016</year>
<article-title>A study of peak finding algorithms for the autocorrelation function of speech signal</article-title>
<source>Jounal of The Korea Society of Computer and Information</source>
<volume>21</volume><issue>12</issue>
<fpage>131</fpage><lpage>137</lpage>
<pub-id pub-id-type="doi">10.9708/jksci.2016.21.12.131</pub-id>
</element-citation>
</ref>
<!-- [13] P. C. Pandey, and M. S. Shah, Estimation of place of articulation during stop closures of vowel-consonant-vowel utterances, IEEE Trans. on Audio, Speech, and Language Processing, Vol. 19, No. 3, 2011.-->
<ref id="B013">
<label>[13]</label>
<element-citation publication-type="journal">
<person-group>
<name><surname>Pandey</surname><given-names>P. C.</given-names></name>
<name><surname>Shah</surname><given-names>M. S.</given-names></name>
</person-group>
<year>2011</year>
<article-title>Estimation of place of articulation during stop closures of vowel-consonant-vowel utterances</article-title>
<source>IEEE Trans. on Audio, Speech, and Language Processing</source>
<volume>19</volume><issue>3</issue>
</element-citation>
</ref>
<!-- [14] L. R. Rabiner, and R. W. Schafer, Theory and applications of digital speech processing, 1st edition, Prentice-Hall, Upper Saddle River, NJ. 2011.-->
<ref id="B014">
<label>[14]</label>
<element-citation publication-type="book">
<person-group>
<name><surname>Rabiner</surname><given-names>L. R.</given-names></name>
<name><surname>Schafer</surname><given-names>R. W.</given-names></name>
</person-group>
<year>2011</year>
<source>Theory and applications of digital speech processing</source>
<comment>1st edition</comment>
<publisher-loc>Upper Saddle River, NJ</publisher-loc>
<publisher-name>Prentice-Hall</publisher-name>
</element-citation>
</ref>
<!-- [15] I. V. McLoughlin, Speech and audio processing, Cambridge University Press, New York, 2016.-->
<ref id="B015">
<label>[15]</label>
<element-citation publication-type="book">
<person-group>
<name><surname>McLoughlin</surname><given-names>I. V.</given-names></name>
</person-group>
<year>2016</year>
<source>Speech and audio processing</source>
<publisher-loc>New York</publisher-loc>
<publisher-name>Cambridge University Press</publisher-name>
</element-citation>
</ref>
</ref-list>
<ack>
<title>감사의 글</title>
<p>이 논문은 년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임(NRF-2016S1A5A2A093927522)</p>
</ack> 
<bio>
	<p><graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f009.jpg"></graphic><bold>Kwang-Bock You</bold> received the Ph.D., in ECE from Stevens Institute of Technology, Hoboken, NJ., USA, in 1998. Dr. You joined the School of Electronic Engineering, Soongsil University as an Associate Professor in 2010. He is interested in speech signal processing, sampling theorem, and wireless communications.</p>
<p><italic>E-mail address</italic>: <email>kwangbockyou@ssu.ac.kr</email></p>
	<p><graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f010.jpg"></graphic><bold>Shin-Ae So</bold> received the B.S., M.S. and Ph.D. degrees in Korean Language and Literature from Sogang University, Korea, in 1999, 2002 and 2006, respectively. Dr. So is currently an Assistant Professor in the Department of Korean Language and Literature, Soongsil University. She is interested in Korean phonology, Korean dialectology, and linguistic variation and change.</p>
<p><italic>E-mail address</italic>: <email>hetaira@ssu.ac.kr</email></p>
	<p><graphic xlink:href="../ingestImageView?artiId=ART002497011&amp;imageName=jkits_2019_14_04_411_f011.jpg"></graphic><bold>Kang-Hee Lee</bold> received the B.S., M.S. and Ph.D. degrees in EECS from KAIST, Korea, in 1999, 2001 and 2006, respectively. Dr Lee is currently an Associate Professor in the Department of Digital Media, Soongsil University. He is interested in robotic intelligence &#x0026; emotion and media robotics.</p>
<p><italic>E-mail address</italic>: <email>kanghee.lee@ssu.ac.kr</email></p>
</bio>
</back>
</article>
