버트 미세조정 - 슬롯 태깅

Using Tech

팀장, 총괄

이슬

챗봇 알고리즘, BERT 모델링

박민아

웹코딩, PPT

정하림

웹코딩, 크롤링

오수문

기술 총괄

신인철

2021.10.18(월) Start

별다방 주문 챗봇

01. 서비스 기획 목적

기존 사이렌오더 서비스가 존재함에도 불구하고 챗봇 서비스를 개발하게 된 이유 = 사이렌오더 앱 설치 및 이용에 대한 불편함, 어려움

02. 서비스 시나리오

: 핵심어 추출로 사용자가 원하는 주문을 챗봇이 정확하게 파악할 수 있도록 함.
: ex) 아메리카노, 라떼, .. = 음료 / 쿠키, 케이크, .. = 음식 / 따뜻하게, 차갑게, .. = 온도 / ..

서비스 시나리오(기본)

서비스 시나리오(예외 발생시)

: 빈 슬롯 발생, 예외 발생 시 필요한 시나리오 구상(챗봇이 인식할 수 없는 주문이 들어올 경우, 어떻게 처리할 것인가에 대한 방안 마련)

03. 파인튜닝 방법

핵심기술사용 : BERT

: pre-training 된 BERT 에게 fine-tuning 을 추가로 시켜 해당 프로젝트의 목적에 맞는 모델 생성

파인튜닝방법 : 슬롯태깅

04. 데이터 수집 방안

05. 서비스 제작 계획

제작 순서

서비스 제작 계획 : 챗봇 구현(대시보드)

: flask, figma, HTML, CSS 를 사용하여 웹서비스로 챗봇 시스템 구현

서비스 제작 계획 : 챗봇 시연(이미지)

06. 서비스 기대효과

소비자 맞춤 서비스 제공
신규 고객 유입 : 스타벅스 어플을 설치 및 가입하지않아도 쉽게 이용 가능하므로 신규 고객의 유입 가능성을 기대해볼 수 있음.
접근성 향상 : 별도의 앱 설치가 필요없으므로 접근성이 용이함.

버트 미세조정 - 슬롯 태깅

(Tensorflow 1.x 버전으로 현재 지원하지 않음)

pretrained BERT 모델을 모듈로 export
- ETRI에서 사전훈련한 BERT의 체크포인트를 가지고 BERT 모듈을 만드는 과정.
- python export_korbert/bert_to_module.py -i {체크포인트 디렉토리} -o {output 디렉토리}
- 예시: python export_korbert/bert_to_module.py -i /content/drive/MyDrive/004_bert_eojeol_tensorflow -o /content/drive/MyDrive/bert-module
데이터 준비
1. 모델을 훈련하기 위해 필요한 seq.in, seq.out이라는 2가지 파일을 만드는 과정
  - python prepare_data.py process_file({변환할 data.txt 파일 경로}, {아웃풋 저장 경로}), process_line(문장, 토큰)
  - '홍길동'을 입력하면 '홍', '길', '동' 으로 분류가 되어 출력이 되므로 좀 더 정확한 분류가 이루어짐
2. 제작한 seq.in, seq.out을 train, validation, test set이 8:1:1 비율이 되도록 나누기
  - split_new.py
Fine-tuing 훈련
- python train.py -t {train set 디렉토리} -v {validation set 디렉토리} -s {model이 저장될 디렉토리} -e {epoch의 수} -bs {batch size의 수}
모델 평가
- python eval.py -m {훈련된 model이 저장된 디렉토리} -d {test set 디렉토리}
- 테스트의 결과는 -m에 넣어준 model 디렉토리 아래의 test_results에 저장됨
Inference (임의의 문장을 모델에 넣어보기)
- python inference.py -m {훈련된 model이 저장된 디렉토리}
- 예시: python inference.py -m saved_model/
- "Enter your sentence:"라는 문구가 나오면 모델에 넣어보고 싶은 문장을 넣어 주면 됨
- 'quit', '종료', '그만', '멈춰', 'stop'라는 입력을 넣어 주면 종료

Name		Name	Last commit message	Last commit date
Latest commit History 147 Commits
code		code
data		data
web_demo		web_demo
README.md		README.md

InChil2/SlotTagging

Folders and files

Latest commit

History

Repository files navigation

Using Tech

팀장, 총괄

챗봇 알고리즘, BERT 모델링

웹코딩, PPT

웹코딩, 크롤링

기술 총괄

2021.10.18(월) Start

별다방 주문 챗봇

목차

01. 서비스 기획 목적

기존 사이렌오더 서비스가 존재함에도 불구하고 챗봇 서비스를 개발하게 된 이유 = 사이렌오더 앱 설치 및 이용에 대한 불편함, 어려움

02. 서비스 시나리오

서비스 시나리오(기본)

서비스 시나리오(예외 발생시)

03. 파인튜닝 방법

핵심기술사용 : BERT

파인튜닝방법 : 슬롯태깅

04. 데이터 수집 방안

05. 서비스 제작 계획

제작 순서

서비스 제작 계획 : 챗봇 구현(대시보드)

서비스 제작 계획 : 챗봇 시연(이미지)

06. 서비스 기대효과

버트 미세조정 - 슬롯 태깅

(Tensorflow 1.x 버전으로 현재 지원하지 않음)

About

Resources

Uh oh!

Stars

Watchers

Forks

Uh oh!

Uh oh!

Languages