cleanUrl: "/Super_NaturalInstructions"
floatFirstTOC: right
title: SuperNI 논문과 데이터셋 분석
description: AI 연구자들이 참여한 SuperNI 프로젝트의 핵심 내용과 1,600여 개의 NLP instruction 데이터셋을 상세히 살펴봅니다.
이 아티클의 전반부는 Super-NaturalInstructions(SuperNI) 논문을 개괄적으로 살펴본 후 후반부에서는 SuperNI에 포함된 데이터 세트 중에서 한국어로 되어 있거나 흥미로운 주제를 담고 있는 데이터 세트를 다룸.
데이터 구조

SuperNI 데이터 세트의 간단한 통계 분석

SuperNI에 포함된 Task의 종류 및 다른 instruction 데이터 세트와 비교


전체 결과 summary
영어 : 발표 당시 기준 InstructGPT 대비 ROUGE-L 점수 기준 9.9점 높음 (52.1 vs 66.0)
다국어 : 발표 당시 기준 InstructGPT 대비 ROUGE-L 점수 기준 13.3점 높음 (52.8 vs 66.1)

Task 유형별 성능 비교
모든 유형에서 InstructGPT보다 더 좋으며 일부 유형에서는 supervised SOTA 성능과 거의 유사한 수준


(이미지출처) Microsoft Designer - Stunning designs in a flash 를 사용하여 자동 생성 후 편집