언어/Python

[Python] 아스키코드 사용하기

SeongOnion 2022. 1. 19. 22:17
728x90

아스키코드란?

미국정보교환표준부호(영어: American Standard Code for Information Interchange), 또는 줄여서 ASCII( /ˈæski/, 아스키)는 영문 알파벳을 사용하는 대표적인 문자 인코딩이다. 아스키는 컴퓨터와 통신 장비를 비롯한 문자를 사용하는 많은 장치에서 사용되며, 대부분의 문자 인코딩이 아스키에 기초를 두고 있다.
- 위키백과

 

쉽게 말해 아스키코드는 알파벳을 비롯한 문자들을 통신하기 위해 일대일 대응시켜 숫자로 정해둔 코드이다.

 

아스키코드 테이블은 다음과 같다.

 

https://shaeod.tistory.com/228

물론 이 표를 다 외우고 있을 필요는 없다.

 

파이썬에서는 ord()와 chr() 함수를 통해 문자를 아스키코드로, 아스키코드를 문자로 변환할 수 있다.

 

print(ord("A"))
print(ord("B"))
print(ord("C"))

# 65
# 66
# 67

print(chr(65))
print(chr(66))
print(chr(67))

# A
# B
# C

 

각 문자에 대한 아스키코드를 모두 외울 필요는 없지만, 알파벳의 아스키코드는 대문자가 소문자보다 더 작다는 것과 알파벳의 순서에 따라 아스키코드의 숫자가 1씩 증가한다는 특징 정도는 알아둘 필요가 있다.

 

바로 이 특징을 이용하면 특정 알파벳에서 N번째 후의 알파벳을 구할 수 있다.

 

# A에서 두 번째 후의 숫자
print(chr(ord("A") + 2))

# C

 

 

이번엔 Z에서 1번째 후의 알파벳을 구하고자 한다.

 

Z는 마지막 알파벳이므로 우리가 기대하는 값은 다시 한 바퀴를 돌아 A 일 것이다.

 

이를 위해 위의 예시처럼 Z의 아스키코드인 90에 1를 더한 값을 다시 문자로 변환하고자 하면 아스키코드는 91가 된다.

 

그리고 이 숫자를 다시 문자로 변환하게 되면 우리가 원하는 "A"가 아닌 아스키코드 테이블에 따라 "["가 리턴될 것이다.

 

print(chr(ord("Z") + 1))

# [

 

모든 알파벳의 개수가 총 26개라는 성질을 이용하면 이 문제를 해결할 수 있다.

 

# 먼저, "Z"의 아스키코드값에 1을 더해준 뒤 해당 값에서 "A"의 아스키코드 값을 빼준다

print(ord("Z") + 1 - ord("A"))

# 26

 

아스키코드 테이블에서 알파벳은 사전 순서대로 1씩 증가하며 위치되어있기 때문에,

 

가장 끝 알파벳인 Z와 맨 첫 알파벳인 A의 아스키코드 값의 차이는 25(알파벳의 개수 - 1)이다.

 

그리고, Z 다음의 알파벳을 구하길 원하기 때문에 해당 차이값에 1을 더해주면 26이 되는 것이다.

 

A의 아스키값을 0이라고 가정할 때, 마지막 알파벳인 Z의 아스키값은 25가 되므로 26은 0 ~ 25의 범위를 초과하게 된다.

 

따라서, 26은 다시 0으로 돌아오게 해야하는데, 나머지 연산을 통해서 이를 구현할 수 있다.

 

print((ord("Z") + 1 - ord("A")) % 26)

# 0

 

계산 순서에 유의하자. 

 

앞선 계산을 모두 마무리 한 후, 26과 나눈 나머지를 구해주어야한다.

 

이렇게 나온 값에 다시 A의 아스키코드를 더해준 후 문자로 변환해주면 Z에서 1번째 후의 알파벳을 구할 수 있다.

 

print(chr(ord("A") + ((ord("Z") + 1 - ord("A")) % 26)))

# A

 

함수로도 구현할 수 있다.

 

ALPHABET_NUMBER = 26

def get_alphabet_after(alphabet, n):
    # 입력받은 alphabet에서 n번째 후의 알파벳을 리턴

    return chr(ord("A") + (ord(alphabet) + n - ord("A")) % ALPHABET_NUMBER)

print(get_alphabet_after("A", 3))
print(get_alphabet_after("Z", 5))
print(get_alphabet_after("C", 1))