Akashic Records

Java source code could switch to UTF-8 encoding 본문

Library

Java source code could switch to UTF-8 encoding

Andrew's Akashic Records 2023. 3. 10. 09:26
728x90

OpenJDK 제안서에 따르면 '잘못 정의된 인코딩'의 현재 상태는 JDK 코드베이스로 작업할 때 불필요한 문제를 발생시킨다.

 

오픈JDK 자바 커뮤니티에서는 더 잘 정의된 인코딩을 용이하게하기 위해 Java Development Kit (JDK)의 소스 코드를 UTF-8 (유니코드 변환 형식)로 다시 작성하는 계획을 추진 중이다.

 

1월 초에 작성된 이 제안서는 2월 28일에 업데이트되어 bugs.openjdk.org에서 찾을 수 있다. 이는 JDK 소스 코드의 현재 상태를 "잘못된 인코딩"으로 설명하며, 사용된 인코딩의 공식 선언이 없다고 하면서 대부분이 ASCII이지만 몇 개의 명확하지 않은 비 ASCII 문자가 있다고 덧붙인다. 이 제안서는 현재 상황이 역사적인 짐 때문에 JDK 코드베이스와 작업할 때 불필요한 문제를 야기한다고 주장한다.

 

UTF-8은 문자 인코딩을 위한 웹 표준으로 여겨지는 유니코드의 바이트 지향 인코딩 형식이며, 2022년 3월 JDK 18을 출시할 때 표준 Java API의 기본 문자 집합으로 지정되었다. 이 새로운 제안서는 다음과 같은 단계를 통해 JDK의 코드베이스를 UTF-8로 변환할 것이다.

  • Git에게 텍스트 파일이 UTF-8로 인코딩되어 있음을 알린다.
  • 비 ASCII 문자를 포함하는 텍스트 파일을 검사하고, 이미 UTF-8이 아니면 UTF-8로 변환한다.
  • Java 빌드 도구를 업데이트하여 이제 파일이 UTF-8임을 인식하고 컴파일러 플래그를 업데이트하여 해당 파일을 처리할 수 있게 한다.
728x90
Comments