Day_66 01. 데이터 구축 가이드라인 작성 기초

작성일

1 분 소요

데이터 구축 가이드라인 작성 기초

가이드라인의 유형

주석을 위한 가이드라인은 필수!, 수집과 검수를 위한 가이드라인은 선택적

문서형 가이드라인 예시

한국어 학습자 말뭉치 구축 가이드라인

튜토리얼 가이드라인 예시

https://www.cashmission.com/cashmission_guide/53

가이드라인의 구성 요소

데이터 구축 목적 정의가 가장 중요!

데이터 구축 목적 정의 예시

작업자들의 작업에 대한 이해도를 높여 더 높은 품질의 데이터를 만들 수 있도록 돕는 역할

[인공지능 (AI) 학습용 데이터 품질관리 가이드라인 (v.1.0)] 한국지능정보사회진흥원 [인공지능 (AI) 학습용 데이터셋 구축 안내서] 한국지능정보사회진흥원

데이터 구축 가이드라인 용어 정의 예시

https://alt.qcri.org/semeval2016/task5/data/uploads/absa2016_annotationguidelines.pdf

데이터 수집 가이드라인 예시

https://kcorpus.korean.go.kr/boardFileDownload.data?seq=63

데이터 체계 제시 예시

https://kcorpus.korean.go.kr/boardFileDownload.data?seq=63

https://www.cis.upenn.edu/-bies/manuals/tagguide.pdf

데이터 구축 도구 사용법 예시

https://balsamiq.com/learn/articles/wireframe-annotations/

섬세하게 도구의 사용법을 알려주는게 좋음

가이드라인 버전 관리

가이드라인은 구축과 검수 과정을 통해 지속적으로 개정되어야 함

개정 전과 개정 후 어떤 것이 변화하였는지 비교하여 볼 수 있도록 버전 관리가 되는 것이 가장 좋음

버전별로 작성자와 개정일을 기입해두는 것이 관리에 도움이 됨

가이드라인 작성 도구

Google Docs

공유가 자유롭고 중간중간 자동으로 저장이 됨

가이드라인 초안을 작성할 때 좋음

Notion

제일 추천하는 도구임

워드 및 한글

정부사업을 하는 경우는 한글이 기본

그외

레이블링 에이전시에서 제공하는 도구
위키
등등

가이드라인 작성 시 유의 사항

가이드라인의 유형별 특성을 이해하고 그에 알맞는 정보를 작성한다.

작업자의 작업 이해도를 고려하여 작성한다.

작업자에게 공개해야 하는 필수 정보와 부가적인 정보가 무엇인지 사전에 고려한다.

가이드라인 구성 요소의 배치를 어떻게 할 지 고민한다.

작업자의 가독성을 고려한다.

꼭 필요한 정보만 넣기! 중요한 정보는 강조!

Further Reading

댓글남기기