거래처에서 받은 상품 데이터가 전부 대문자로 되어 있었다. 수백 줄짜리 목록을 하나하나 소문자로 고치기엔 양이 너무 많고, 중간중간 공백이 두 칸씩 들어간 곳도 있었다. 이런 텍스트 정리 작업은 도구를 쓰면 몇 초면 끝난다.
대소문자 변환, 어떤 유형이 있나
영어 텍스트를 다룰 때 자주 쓰는 대소문자 변환 유형은 네 가지다.
- UPPERCASE: 전체를 대문자로. 약어, 제목 강조에 쓴다.
- lowercase: 전체를 소문자로. 이메일 주소나 URL 정리에 유용하다.
- Title Case: 각 단어의 첫 글자만 대문자로. 영문 제목 작성 시 기본 형식이다.
- camelCase: 첫 단어는 소문자, 이후 단어 첫 글자는 대문자. 프로그래밍 변수명에 쓰인다.
TIP 엑셀의UPPER(),LOWER()함수로도 변환 가능하지만, 수식을 만들고 복사하는 과정이 번거롭다. 한 번 변환하고 끝낼 거라면 온라인 도구가 훨씬 빠르다.
공백과 줄바꿈 정리
웹에서 복사한 텍스트에는 보이지 않는 쓰레기가 꽤 많다. 단어 사이에 공백이 두세 칸 들어가거나, 불필요한 빈 줄이 끼어 있거나, 앞뒤에 눈에 안 보이는 공백이 붙어 있는 경우다.
정리할 때 확인할 항목을 정리하면 이렇다.
- 연속 공백 제거: 공백 두 칸 이상을 한 칸으로 줄인다
- 앞뒤 공백 제거(Trim): 각 줄의 시작과 끝에 붙은 불필요한 공백을 정리한다
- 빈 줄 제거: 내용 없이 줄바꿈만 된 빈 줄을 없앤다
- 중복 줄 제거: 같은 내용의 줄이 여러 번 반복될 때 하나만 남긴다
개발자가 쓰는 인코딩 변환
URL에 한글을 넣으면 %ED%95%9C%EA%B8%80 같은 형태로 바뀐다. URL 인코딩이라고 하는데, 디버깅할 때 이걸 사람이 읽을 수 있는 형태로 디코딩해야 하는 경우가 자주 생긴다. Base64 인코딩/디코딩도 API 작업에서 흔히 만나는 상황이다.
이런 변환 작업을 한 페이지에서 모두 처리할 수 있는 텍스트 변환기가 있다. 입력창에 텍스트를 붙여넣고 원하는 변환 버튼만 누르면 결과가 바로 나온다. 대소문자, 공백, 인코딩까지 한 곳에 모여 있어서 탭을 여러 개 열 필요가 없다.
텍스트 정리는 단순 반복 작업이다. 사람이 직접 하면 시간도 걸리고 실수도 나니까, 도구에 맡기는 게 맞다.