한자문화권을 위한 더 쉬운 자릿수 구분

만진법 프로젝트

동아시아 언어는 만 단위로 수를 셉니다.
자릿수 구분도 그래야 합니다.

이 숫자를 한국어로 읽어 보세요
1,234,567,890 12_3456_7890

어긋남

우리는 아라비아 숫자를 쓸 때 세 자리마다 쉼표를 찍는 방식에 익숙합니다. 1,000,000,000. 그런데 이 수를 한국어로 읽으면 “십억”입니다. 쉼표 세 개가 찍혀 있지만, 한국어 화자가 실제로 수를 끊어 읽는 단위는 넷입니다. 억, 만, 그리고 일의 자리.

세 자리 구분은 천진법(千進法), 즉 1,000을 기준으로 수를 묶는 영미권의 방식입니다. 한국어, 중국어, 일본어는 만진법(萬進法)을 씁니다. 10,000 단위로 끊죠. 이 불일치 때문에 우리는 큰 수를 아라비아 숫자로 볼 때마다 머릿속에서 한 번씩 환산해야 합니다.

한국어로 읽으면

십이억 삼천사백오십육만 칠천팔백구십

직접 비교해 보기

아무 수나 입력해 보세요. 같은 자릿수가 세 자리 쉼표와 네 자리 밑줄로 어떻게 다르게 나뉘는지, 그리고 실제 한국어 읽기와 어느 쪽이 맞는지 확인할 수 있습니다.

숫자를 입력하면 비교가 표시됩니다.

  • 세 자리 구분 1,234,567,890
  • 네 자리 구분 12_3456_7890
  • 한국어 읽기 12억 3456만 7890

제안

만 단위 구분자로 밑줄(_)을 씁시다.

밑줄은 ASCII 범위 안에 있어 어떤 키보드에서도 바로 입력할 수 있습니다. 쉼표와 시각적으로 충분히 구별되고, 숫자 맥락에서 다른 의미로 쓰이지 않습니다. Python, Rust 등 여러 프로그래밍 언어가 이미 수 리터럴 구분자로 밑줄을 채택하고 있어, 소프트웨어 생태계에서도 낯설지 않습니다.

기존

1,234,567,890

제안

12_3456_7890

천 단위 쉼표와 병용하기

밑줄이 만 단위, 쉼표가 천 단위를 나타내어 두 체계가 계층적으로 공존할 수 있습니다. 국제 문서나 혼용이 필요한 맥락에서 유용합니다.

병용 1,2_34,56_7,890

왜 네 자리 쉼표가 아닌가

가장 단순한 대안은 쉼표를 네 자리마다 찍는 것입니다. 그러나 쉼표는 이미 세 자리 구분자로 전 세계에 굳어져 있습니다. 소프트웨어, 금융 시스템, 국제 표준이 모두 이를 전제로 작동하고, 세 자리 쉼표에 익숙한 독자에게는 네 자리 쉼표가 오히려 오독을 유발합니다.

기호를 바꾸는 대신 추가하면, 기존 표기와 충돌 없이 만진법 가독성을 얻을 수 있습니다.

다른 후보들

밑줄에 이르기까지 여러 기호를 검토했습니다.

  1. 가운뎃점

    · U+00B7

    동아시아 활자 문화에서 친숙하고 쉼표와 시각적으로 잘 구별됩니다. 그러나 대부분의 키보드에서 바로 입력할 수 없어 일상적 사용에 장벽이 됩니다.

  2. 좁은 공백

    U+2009

    ISO 80000-1이 자릿수 구분자로 권장하는 방식으로 표준 친화적입니다. 그러나 일반 공백과 육안으로 구별되지 않고, 텍스트 처리 시 예기치 않게 동작할 수 있습니다.

  3. 아포스트로피

    ' U+0027

    ASCII 범위 안에 있어 입력이 쉽지만, 스위스에서 이미 세 자리 구분자로 쓰이고 있어 혼동의 여지가 있습니다. 더 결정적으로, Microsoft Word, Google Docs, 모바일 키보드 등 많은 소프트웨어가 아포스트로피를 곡선 따옴표로 자동 변환합니다.

  4. 일반 공백

    U+0020

    입력이 가장 쉽지만, 숫자를 별개의 토큰으로 분리시켜 검색, 복사·붙여넣기, 데이터 파싱에서 문제가 됩니다. 줄 바꿈이 숫자 한가운데서 일어날 수도 있습니다.

어떻게 쓸 수 있나

글쓰기에서는 지금 당장 쓸 수 있습니다. 밑줄 키를 누르기만 하면 됩니다.

소프트웨어나 데이터에서는 아직 이 표기를 자동으로 처리하는 표준이 없지만, 파싱 전에 밑줄을 제거하면 그만입니다.