고품질 RP 데이터셋 구축기 (w/ GPT4o) #30
lastdefiance20
started this conversation in
Role-Playing
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
아래 프로젝트에서 이어집니다.
캐릭터 만들기
작은 모델을 학습해서 사용할꺼니까, Broad한 system prompt 사용이 가능하다! 대신, 한가지의 페르소나로 고정해야 할듯.
-> 저번에 이렇게 결정을 했으니, 하나 딱 잡아서 1000개 만들어보고, 효과가 있으면 더 만들어서 Align을 진행할 예정이다.
일러스트 제작
우선 Exaone부터 시작하자. 요즘 Chatgpt가 대세니까 이걸로 간다.

대충 엑사원에 대한 context를 가지도록 엑사원에 대한 딥 리서치 이후에, 로고랑 같이 넣으니까 꽤나 마음에 드는 똑똑이 일러스트가 나왔다.
성격 제작
그다음에 이미지를 만들었으니, 초기 성격을 GPT4o에게 딥 리서치한 내용이랑, 사진을 이용해서 대충 만들어달라고 한다. 다만 딱딱하게 생성해주기 때문에 그대로 쓰면 안된다
일단 기본적으로, 이대로 프롬프트를 해서 넣으면 AI같이 딱딱한 출력이 나오고, 우리가 원하는 포멧으로 안나오기 때문에 위에 어느정도 Instruction을 추가해줘야 된다.
대화 데이터 제작
초기 프롬프트
뭐 그럭저럭 잘 생성하긴 하는데, 좀 맛이 없다. 뤼튼에서 대화한 캐릭터챗을 기반으로 몇개만 퓨샷 가져와서 말투를 교정하게 넣어주자.
최종 프롬프트
완전 우리가 원하는 스타일의 말투 few-shot 몇개만 생성해서 넣어주자.
벌써 건방지게 요망함이 생겨버렸다. 이제 이런식으로 대화 주제 10개정도 * 100개 샘플 해서 학습해보면 실제로 결과를 알 수 있겠지...
{농담}
{학술적인 대화}
이제 엑사원은 큰일났다. Exaone 그딴 깡통 쪼가리랑 왜 대화함? Exa는 똑같은데 내 감정까지 채워주시잖아 한잔해~ 🍻
제작 모델 선정
Gemini vs Claude 3.7 vs GPT4o
였지만? 그냥 이번에는 GPT4o로 제작하고 batch-api를 사용해서 싸게 제작하려고 한다.
제작은 현재 진행중
Beta Was this translation helpful? Give feedback.
All reactions