www.sejong21.org

세종시맨틱검색시스템 ( Sejong Semantic Search System )



소개

-21c세종계획
-전자사전개요
-전자사전통계
-전자사전기술대상
-전자사전구축지침
-전자사전미시구조
-전자사전전문분야
-고유명사하위분류체계
-의미정보없는사전어휘
-말뭉치통계

세종온톨로지

세종어휘의미망

세종전자사전

세종전문용어

데이타셋
(Downloads)

열린서비스

만든이

    세종 전자사전 >> 기술대상

분류사 상세 사전

※ 구축지침 보기 ※ 미시구조 보기

[기술 대상 범주]

분류사는 그 사용 영역 및 결합되는 명사 부류, 지각 속성에 따라 하위분류되어야 하겠지만, 여기서는 우선 척도와 수량으로 대분류한다. 척도는 다시 ‘길이, 넓이, 부피, 무게, 시간, 속도, 화폐’ 등으로 하위분류하고, 수량은 해당 명사의 의미 부류에 따라 ‘사람, 사물, 동물’ 등으로 나누기로 한다. 또한 수량 중에서 특정 어휘와 결합하는 경우, 그 어휘를 개별적으로 명세하기로 한다. 척도와 수량으로 대분류하는 기준은 결합하는 명사와의 의미적 관련성 여부에 따른다. 즉 수량은 정도의 차이는 있지만 결합하는 명사에 대한 일정한 어휘적/의미적 제한이 따른다(사물-개, 시체-구, 사람-명, 두부-모, 김-톳, 오징어-축, 말-필, 생선-손, 의류-벌 등). 반면에 척도는 결합하는 명사에 대하여 이러한 어휘적/의미적 제한이 따르지 않는다. 예컨대 ‘자’는 길이를 잴 수 있는 명사는 어느 것이나 결합 가능하며, ‘섬’도 그 속에 들어가는 대상과 관계가 없다. 또한 시간이나 횟수를 나타내는 분류사는 특정한 명사와 의미적인 관련성을 별로 맺지 못한다는 점에서 척도에 포함시키기로 한다.




[기술 대상 목록 ]

의존명사/대명사/수사 상세전자사전에 등재될 표제어들은 우선, 언어학적 기준에 입각한 범주 정의 및 그에 따른 기술 범위의 한정이라는 과정을 통해 체계적으로 선정되었다. 이 작업과 동시에 그 목록은 어느 정도 형식화한 기준에 따라 하위분류되었다. 왜냐하면 하위 분류 체계에 따른 표제어 목록화는 사전의 언어 정보와 처리 모형을 체계화하는 데 필수적인 선결 과제이기 때문이다. 본 사전에 수록되는 표제어들은 교육용 어휘 목록, 빈도 자료, KLEAR 목록 등을 활용하여 선별하고, 기존의 국어 말뭉치와 “기초 자료 언어 기반” 1차년도 과제의 결과물로 구축되는 세종 말뭉치를 활용하여 표제어 목록을 작성하였다. 전체 목록(약 1,200 항목)의 선정 작업은 목록 선정 기준에 대한 연구와 기본 어휘의 목록화를 거쳐 이루어졌으며, 구체적인 표제어의 선정 기준은 각 범주의 정의 방식과 기술 범위에 따라 결정했다. 목록 작성은 분류학적 틀에 입각해서 하위 부류를 체계적으로 기술하는 것이다. 각 어휘의 형태/통사적 특성, 통사 특성과 제약, 의미 부류 등에 따른 목록화는 어휘의 기능적 분류를 마련한다는 점에서 사전의 기술 구조를 결정짓는 중요한 예비 작업이 된다. 표제어는 품사 또는 하위 품사(일반의존명사, 단위명사, 대명사, 수사)별로 목록화하고, 어느 정도 형식화된 분류 틀에 따라 하위분류하였다. 표제어 선정에서 고려해야 할 것 중 하나는 타 사전과 공유하게 될 다중 범주어 처리 문제이다. 의미 정보 기술에도 관련되는 이 원칙에 따르면, 동형어/다의어 처리 기준은 어원의 동일성 여부와 의미적 유사성에 두는 것이 마땅하다. 우리는 품사 범주와 용법의 상이성 및 전산 처리의 효율성을 고려하여 다중범주어는 동형이의어로 분류하기로 하였다.

분류사는 그 사용 영역 및 결합되는 명사 부류, 지각 속성에 따라 하위분류되어야 하겠지만, 여기서는 우선 척도와 수량으로 대분류한다. 척도는 다시 ‘길이, 넓이, 부피, 무게, 시간, 속도, 화폐’ 등으로 하위분류하고, 수량은 해당 명사의 의미 부류에 따라 ‘사람, 사물, 동물’ 등으로 나누기로 한다. 또한 수량 중에서 특정 어휘와 결합하는 경우, 그 어휘를 개별적으로 명세하기로 한다. 척도와 수량으로 대분류하는 기준은 결합하는 명사와의 의미적 관련성 여부에 따른다. 즉 수량은 정도의 차이는 있지만 결합하는 명사에 대한 일정한 어휘적․의미적 제한이 따른다(사물-개, 시체-구, 사람-명, 두부-모, 김-톳, 오징어-축, 말-필, 생선-손, 의류-벌 등). 반면에 척도는 결합하는 명사에 대하여 이러한 어휘적․의미적 제한이 따르지 않는다. 예컨대 ‘자’는 길이를 잴 수 있는 명사는 어느 것이나 결합 가능하며, ‘섬’도 그 속에 들어가는 대상과 관계가 없다. 또한 시간이나 횟수를 나타내는 분류사는 특정한 명사와 의미적인 관련성을 별로 맺지 못한다는 점에서 척도에 포함시키기로 한다.


뒤로




만든이   권리   도움말   참여   즐겨찾기추가   시작페이지로
0