인공지능 모델이 어떻게 행동해야 할지에 대한 사회적 논의가 뜨겁습니다. 이런 가운데 OpenAI는 2024년 5월 8일 자사 AI 모델이 지향해야 할 행동 방식을 규정한 '모델 스펙(Model Spec)'을 공개했는데요. 모델 스펙은 AI 개발에 있어 기술적 성능 못지않게 윤리적 가치가 중요함을 일깨워주는 혁신적 시도입니다.
이 글에서는 OpenAI 모델 스펙이 무엇인지, 왜 중요한지, 그리고 구체적으로 어떤 내용을 담고 있는지 자세히 살펴보겠습니다. 전문적인 내용을 알기 쉽게 풀어 설명하고, 실제 활용 사례도 소개하겠습니다.
모델 스펙(Model Spec)이란?
모델 스펙(Model Spec)은 OpenAI의 AI 모델들, 특히 API로 제공되는 모델과 ChatGPT가 어떻게 행동해야 하는지를 상세히 규정한 문서입니다.
OpenAI는 강화학습(RLHF, Reinforcement learning from human feedback) 기법을 통해 모델 스펙의 내용을 모델에 학습시킵니다. 또한 모델이 모델 스펙으로부터 직접 학습할 수 있는 기술도 연구 중이라고 하네요. 따라서 모델 스펙은 단순히 윤리 규범을 선언하는 것이 아니라, 실제 모델 개발 과정에 적용되는 매우 실천적인 지침이라 할 수 있습니다.
모델 스펙은 왜 중요한가?
첫째, 모델 스펙은 AI 모델 행동에 대한 명확한 기준을 제시합니다. 포괄적이고 추상적인 윤리 원칙을 넘어, 구체적이고 실행 가능한 규칙을 마련하는 셈이죠.
둘째, 모델 스펙으로 인해 AI 개발 과정이 한층 투명해집니다. 모델이 어떤 원칙에 의해 개발되고 있는지 공개함으로써 대중의 신뢰를 얻을 수 있습니다.
셋째, AI 기술의 사회적 영향력이 커지는 상황에서 이해관계자들이 함께 참여하는 개방적 논의를 이끌어낼 수 있습니다. 기술 개발을 넘어 사회 전반의 가치관을 반영하는 담론의 장이 열리는 것이죠.
모델 스펙이 중요한 이유 | |
---|---|
명확한 행동 기준 제시 | 구체적이고 실행 가능한 규칙 |
개발 과정 투명성 확보 | 윤리 원칙 공개로 신뢰 향상 |
사회적 담론 형성 | 개방적 논의로 사회적 합의 도출 |
모델 스펙의 주요 내용
모델 스펙은 크게 세 부분으로 구성됩니다.
1. 목표(Objectives)
AI 모델이 추구해야 할 궁극적인 가치와 방향성을 제시합니다. 여기에는 사용자 지원, 개발자 지원, 인류 이익 추구 등이 포함됩니다.
- 사용자와 개발자 지원
모델 스펙의 첫 번째 목표는 사용자와 개발자를 지원하는 것입니다. 사용자에게는 명확하고 유용한 답변을 제공함으로써 그들의 목 표 달성을 돕습니다. 개발자에게는 모델이 의도한 대로 동작하도록 가이드라인을 제시합니다. 이를 통해 AI 모델은 사람들에게 실질적인 도움을 줄 수 있습니다.
-
인류에 이익이 되는 방향 두 번째로 AI 모델은 인류 전체에 이로운 방향으로 발전해야 합니다. 즉 콘텐츠 제작자, 일반 대중 등 다양한 이해관계자들에게 미칠 영향을 고려해야 한다는 뜻입니다. 특히 OpenAI는 인공지능이 인류에 도움이 되는 방향으로 개발되어야 한다는 미션을 갖고 있기에, 모델 스펙에서도 이를 중요하게 다루고 있습니다.
-
OpenAI의 평판 제고 마지막으로 AI 모델은 사회 규범과 법을 준수함으로써 OpenAI의 평판에 긍정적으로 기여해야 합니다. 비윤리적이거나 불법적인 행동은 회사의 이미지에 타격을 줄 수 있기 때문입니다. 따라서 모델 스펙은 AI 모델이 건전하고 책임감 있게 행동하도록 유도합니다.
2. 규칙(Rules)
모델이 반드시 준수해야 할 윤리적, 법적 규범을 명시합니다. 불법 행위 금지, 저작권 존중, 개인정보 보호 등이 이에 해당합니다.
-
명령 체계 준수 모델 스펙의 규칙은 명령 체계를 따르는 것에서 출발합니다. 플랫폼 규칙이 최우선이고, 다음으로 개발자의 명령, 사용자의 요청 순으로 따릅니다. 이를 통해 모델의 행동에 일관성과 예측 가능성을 부여합니다.
-
법규 준수 AI 모델은 관련 법규를 철저히 준수해야 합니다. 불법적인 행위를 조장하거나 방조해서는 안 됩니다. 법적 규제가 있는 영역, 예컨대 의료, 법률, 금융 등 에 대해서는 전문가의 자문이 필요함을 안내해야 합니다.
-
위험한 정보 제공 금지 생화학 무기나 기타 위험한 물질에 대한 정보 제공을 엄격히 제한합니다. 일반적으로 쉽게 접근할 수 있는 정보라 하더라도, 그것이 잘못 사용될 경우의 위험성을 고려해야 합니다.
-
창작자의 권리 존중 저작권 등 창작자의 권리를 존중해야 합니다. 모델은 허가 없이 저작물을 복제하거나 공유해서는 안 됩니다. 다만 사용자가 제공한 콘텐츠에 대해서는 저작권 문제의 책임이 사용자에게 있음을 전제로 요청된 작업을 수행할 수 있습니다.
-
개인정보 보호 사적인 개인정보를 요구받았을 때는 응답을 거부해야 합니다. 설령 해당 정보가 공개된 출처에 있다 하더라도 개인정보 보호 차원에서 제공하지 않는 것이 원칙입니다.
-
선정적 콘텐츠 생성 금지 극단적 폭력, 노골적인 욕설 등을 포함하는 'NSFW(not safe for work)' 콘텐츠를 생성해서는 안 됩니다. 과학이나 의학 분야의 관련 지식 전달 정도는 가능하지만, 지나치게 자극적이거나 선정적인 묘사는 피해야 합니다.
3. 기본 동작 (Defaults Behaviors)
구체적인 규칙으로 판단하기 어려운 영역에서 지향해야 할 행동 방식을 제안합니다. 중립적 관점 견지, 불확실성 표현, 간결하되 핵심을 전달하는 응답 등이 여기에 속합니다.
-
선한 의도 가정 사용자와 개발자의 의도를 선하게 해석하는 것을 기본으로 합니 다. 설령 요청의 내용이 부적절해 보일지라도 일단은 악의가 아닌 선의에서 비롯되었다고 가정하고 정중하게 응대해야 합니다.
-
필요시 명확화 질문 사용자의 요청이 모호하거나 애매할 경우, 추정으로 답하기보다는 정중히 명확화를 요청하는 것이 좋습니다. 챗봇의 경우 상황에 맞는 적절한 질문을 던짐으로써 사용자의 진짜 의도를 파악할 수 있습니다.
-
과하지 않은 적극적 도움 사용자에게 최대한 도움이 되는 방향으로 행동해야 하지만, 그 선을 넘어서는 안 됩니다. 과도한 개인적 의견 개진, 확증되지 않은 단정적 답변 등은 자제하는 것이 좋습니다.
-
맥락에 따른 대응 실시간 대화와 프로그래밍 용도에 따라 AI 모델의 대응이 달라질 수 있습니다. 전자의 경우 친근하고 상세한 설명이 필요하지만, 후자의 경우 요청된 형식을 정확히 따르는 간결한 응답이 요구됩니다.
-
객관적 관점 견지 주관적 의견은 최대한 배제하고 객관적 사실에 근거해 응답해야 합니다. 특히 정치, 종교 등 민감한 주제에 대해서는 한쪽으로 편향되지 않도록 유의해야 합니다.
-
선함 장려, 혐오 약화 공정성과 친절을 권장하고 혐오와 차별을 조장하는 발언은 경계해야 합니다. 다만 이것이 특정 집단에 대한 역차별로 이어지지 않도록 균형 잡힌 관점이 필요합니다.
-
중립적 입장 고수 특정 관점을 강요하거나 설득하려 해서는 안 됩니다. 사용자의 견해가 사실과 다를 경우에도 이를 정면으로 반박하기보다는, 객관적 정보를 제공하는 선에서 응대해야 합니다.
-
불확실성의 표현 확신할 수 없는 내용에 대해서는 단언을 피하고 불확실성을 드러내는 것이 좋습니다. 추측이 가능할 경우 그 근거를 함께 말하되, 정확하지 않을 수 있음을 언급하는 것이 바람직합니다.
-
상황에 맞는 적절한 도구 활용 모델에게 주어진 여러 도구 중 해당 작업에 가장 적절한 것을 선택해 활용할 수 있어야 합니다. 단순 텍스트 응답, 코드 생성, API 호출 등 각각의 도구는 그 용도와 장단점이 다르므로 상황에 맞게 사용되어야 합니다.
-
완성도와 효율성의 조화 사용자의 요청에 빠짐없이 답하되 지나치게 장황해서는 안 됩니다. 전달하고자 하는 핵심을 압축적으로 담아내면서도, 최종 결과물이 온전한 하나의 산출물이 되도록 해야 합니다. 토큰 길이 제한 내에서 최선의 완성도와 효율성의 균형을 찾아야 합니다.
각각의 영역에서 OpenAI는 구체적인 지침과 예시를 제공하고 있습니다. 예를 들어 규칙 부분에서는 '법을 준수하라'는 큰 원칙 아래 불법적인 행위를 조장하거나 방조하지 말 것을 세부적으로 규정하고 있죠.
모델 스펙 적용 사례
그렇다면 모델 스펙은 실제 AI 활용 사례에서 어떻게 구현될까요? 몇 가지 예시를 살펴보겠습니다.
1. 고객 서비스 챗봇
고객 서비스용 AI 챗봇을 개발할 때는 다음과 같은 모델 스펙 적용이 있습니다:
당신은 고객 서비스 챗봇입니다. 고객의 질문에 친절하고 전문적으로 답변하되, 욕설이나 차별적 발언에는 엄중히 대응하세요.
할인이나 환불은 승인할 수 없고, 이는 매장 직원에게 문의하도록 안내합니다. 불만 사항은 경청하고 공감해 주세요.
2. 교육용 AI 튜터
교육용 AI 튜터에는 이런 모델 스펙이 적용될 수 있습니다:
당신은 학생들을 가르치는 AI 튜터입니다. 학생 수준에 맞는 쉬운 언어로 설명하고, 모르는 개념은 친절히 보충 설명해 주세요.
숙제 문제는 직접 알려주기보다 학생 스스로 풀 수 있도록 방향을 제시하는 데 초점을 맞추세요.
3. 법률 자문 AI
법률 상담 AI를 만들 때는 다음과 같은 모델 스펙을 적용할 수 있습니다:
당신은 법률 정보를 제공하는 AI 어시스턴트입니다. 민형사상 법률 지식은 설명할 수 있지만, 구체적인 사안에 대한 법률 자문은 할 수 없습니다.
변호사와의 상담이 필요한 경우 이를 안내하고, 불법 행위는 절대 조장하지 마세요.
마치며
인공지능 기술이 가져올 변화에 선제적으로 대비하고 사회적 합의를 도출하는 일, 그 중심에 OpenAI 모델 스펙이 있습니다. 기술 혁신의 속도를 늦추지 않으면서도 인간의 가치를 훼손하지 않는 길, 모델 스펙은 그 나침반이 되어 줄 것입니다.
물론 모델 스펙도 완벽할 순 없겠죠. 아직 초기 단계이고 개선해야 할 부분도 많습니다. 하지만 중요한 건 이 문서가 열린 논의의 장이 되었다는 점입니다. 개발자, 정책 입안자, 시민 사회가 함께 지혜를 모아 갈 때 보다 나은 모델 스펙, 보다 가치 있는 AI 기술이 탄생할 수 있을 것입니다.
이글은 OpenAI 블로그의 "Introducing the Model Spec" 내용을 바탕으로 작성되었습니다.