GS 인증, 문서만 잘 내면 될 줄 알았습니다

처음에는 GS 인증을 서류 작업 정도로 예상했습니다. 필요한 문서를 정리하고, 기능이 동작하는 걸 보여주면 되리라 생각했죠. 두 달간의 시험을 마친 지금 돌아보면, 그 예상은 절반만 맞았습니다.

이 글은 XGEN Agentic AI Platform이 GS 인증을 받으러 간 여정의 첫 편입니다. 성과를 자랑하려는 기록이라기보다, 같은 길을 준비하는 팀이 있다면 저희가 시간을 많이 쓴 지점을 미리 공유하려는 목적입니다.

시리즈 · GS 인증 여정 — 전 5부

문서만 잘 내면 될 줄 알았습니다 (지금 읽는 글)

시험 첫날, 문서와 제품이 다른 말을 하고 있었습니다

"이 답변, 근거가 뭐죠?" — AI라서 받은 질문들

고치고 나서가 진짜 시작이었습니다

아직 "획득했다"고 말하지 않는 이유

시작은 고객의 질문이었습니다

엔터프라이즈 AI 솔루션을 금융이나 공공에 제안하면, 담당자분들은 대체로 같은 질문을 먼저 던집니다.

"이 AI 솔루션, 믿고 맡겨도 됩니까?"

여기에 "믿으셔도 됩니다"라고 답하는 일은 어렵지 않습니다. 어려운 건 그 말을 증명하는 방법이죠. 저희가 내린 결론은 명확했습니다. 저희 스스로가 아니라 제3자가 같은 기준으로 검증하게 하자. 그렇게 XGEN을 GS 인증 시험대에 올리기로 했습니다.

GS 인증을 짧게 정리하면

GS(Good Software) 인증은 「소프트웨어 진흥법」에 근거한 국가 공인 소프트웨어 품질인증입니다. 표현이 다소 딱딱한데, 성격만 놓고 보면 소프트웨어판 건강검진에 가깝습니다.

공인 시험기관이 ISO/IEC 25000이라는 국제표준을 기준 삼아, 제품이 선언한 대로 동작하는지를 직접 시험합니다. 기능이 명세와 맞는지, 예외 상황에서 안전하게 버티는지(신뢰성), 실무자가 무리 없이 쓰는지(사용성), 보안 요건을 지키는지를 하나씩 확인하죠. 서류만 검토하는 절차가 아니라, 선언한 품질과 실제 동작이 일치하는지를 끝까지 대조하는 과정입니다.

AI 제품에는 다른 무게의 질문이 따라옵니다

전통적인 소프트웨어는 상대적으로 검증이 명확합니다. 입력에 대한 출력이 정해져 있으니까요. 반면 생성형 AI는 같은 질문에도 응답이 조금씩 달라집니다. 이 비결정성 때문에, AI 제품일수록 외부 기준의 검증이 더 중요해집니다.

시험에서 반복될 질문이 무엇일지는 어느 정도 예상하고 있었습니다.

"이 답변의 근거는 무엇입니까? 모델이 그럴듯하게 지어낸 것은 아닌가요?"

다행히 XGEN은 처음부터 근거가 없으면 '판단 불가'를 선언하도록 설계돼 있었습니다. "모른다"고 답하는 동작이 제품의 약점으로 비칠까 고민도 있었는데, 시험 관점에서는 오히려 강점이 됐습니다. 이 이야기는 결함 대응을 다루는 3편에서 자세히 풀겠습니다.

여정의 시작점

2026년 4월 28일, 공인 시험기관의 시험 협약 요청을 확인하고 승인·회신하며 절차를 시작했습니다. 이후 시험 일정을 확정하고, 약 두 달간 문서와 코드가 같은 말을 하고 있는지 확인하는 과정이 이어집니다.

다음 편에서는 시험 첫날, 시험기관 앞에서 문서와 실제 제품의 간극을 확인하며 무엇을 다시 맞췄는지 정리하겠습니다.

XGEN의 인증·품질 현황은 Applied AI에도 정리해 두었습니다.

다음 편 → 시험 첫날, 문서와 제품이 다른 말을 하고 있었습니다