1) 이진트리 이진트리는 부모 하나 당 최대 2개까지의 자식노드를 가질 수 있는 트리를 말한다. 따라서 이진트리의 각 노드 인스턴스는 자신의 부모 노드에 대한 레퍼런스와 두 자식노드에 대한 레퍼런스를 가지게 된다. 이진트리의 노드 클래스를 구현하면 다음과 같다. # 이진트리의 노드 class Node: def __init__(self, data): # 파라미터로 받은 데이터를 삽입 self.data = data # None으로 초기값을 지정 후, 노드 생성 후에 지정 self.left_child = None self.right_child = None 이후, 각 데이터를 담은 노드 클래스를 만들어주고 자식 관계를 설정해주고 나면 노드를 통해 그 노드의 부모노드와 자식노드를 모두 호출할 수 있게 된다. 2)..
트리 자료구는 이전에 살펴봤던 링크드 리스트, 해시테이블과는 다르게 데이터들을 계층적으로 저장하여 관리한다. 이말은 즉, 삽입된 데이터 간에 높낮이 혹은 서열이 있다는 뜻으로 이해할 수 있겠다. 링크드 리스트의 노드를 정의할 때 데이터 값과 다음 노드에 대한 레퍼런스를 next 라는 이름으로 저장한 것과 반대로, 트리의 경우 노드에 데이터값과 자신의 윗 노드, 아랫 노드에 대한 레퍼런스를 저장하고 이를 각각 부모노드, 자식노드라 칭한다. root 노드 트리의 맨 시작점이 되는 노드이다. 링크드 리스트에서 head 노드를 따로 관리해줬던 것처럼 트리에서는 제일 윗 노드를 root라는 이름으로 따로 관리해준다. 형제노드(자매노드) Siblings 동일한 부모를 공유하는 다른 노드들을 말한다. 위 트리에선 F..
큐와 유사한 자료구조 중 스택 자료구조가 있다. 스택은 큐와 다르게 LIFO (Last-in First-out) 의 방식으로 데이터를 관리한다. 즉, 마지막에 들어온 데이터가 먼저 아웃된다. 이러한 방식의 데이터 관리는 여러 방식에서 다양하게 쓰일 수 있는데, 우리가 흔히 컴퓨터 작업에서 사용하는 실행취소 및 복원 잡업 등에서 사용할 수 있다. 스택을 통해 구현할 수 있는 작업은 다음과 같다. 1) 맨 뒤에 새로운 데이터 추가 - append 2) 맨 뒤의 데이터 삭제 후 삭제된 데이터 리턴 - pop 3) 맨 뒤의 데이터에 접근 - stack[-1] 스택 또한 collections의 deque를 이용할 수 있다. 그러나, 큐의 경우와는 다르게 맨 뒤의 값에 접근하는 연산은 동적배열과 링크드 리스트 모두..
큐는 데이터를 FIFO (First-in First-out) 방식으로 관리하는 자료구조이다. FIFO라는 말 그대로 처음 들어온 데이터를 먼저 나가는, 우리가 아는 마트 계산대나 은행 창구에서 고객을 처리하는 방식과 동일하게 작동한다. 실제로 대기줄 자체를 영어로 큐 (Queue)라고 부르기도 하며, 이 특성 덕분에 서로 다른 데이터 간의 순서를 유지할 수 있다. 큐에 구현되어 있는 대표적 기능은 다음과 같다. 1) 맨 뒤에 데이터를 추가 - append 2) 맨 앞 데이터에 접근 - deque[0] 2) 맨 앞 데이터를 삭제 후 삭제한 값을 리턴- popleft 파이썬에서는 collections에서 제공하는 deque를 이용해 큐를 이용할 수 있다. from collections import deque..
Chaining 이외에도 해시테이블의 충돌을 해결하는 방식 중 Open Addressing이 있다. Open Addressing의 개념은, 해시테이블에 동일한 해시함수 값을 가진 데이터들이 저장될 경우 다른 비어 있는 자리를 찾아 해당 데이터를 삽입한다는 것이다. Open Addressing은 선형탐사(Linear probing), 제곱탐사(Quadratic probing), 그리고 이중해싱(Double hashing)가 있다. 1. 선형탐사 (Linear probing) 선형탐사는 데이터가 삽입될 자리에 이미 다른 데이터가 있다면, 한 칸씩 내려가며 빈 자리에 데이터를 저장한다. 76, 93, 40은 각각의 해시함수값이 6, 2, 5로 서로 겹치지 않아 해당 인덱스에 저장된다. 다음으로 삽입되는 47은..
해시테이블의 충돌을 해결하기 위한 대표적인 방식 중 하나로 Chaining 방식이 있다. Chaining 방식은 말 그대로 동일한 해시함수 값을 가진 데이터들을 연결시켜 하나의 인덱스에서 접근할 수 있도록 하는 방식이다. 앞서 포스팅했던 링크드 리스트를 각 chain으로 사용하면 Chaining 방식을 구현할 수 있다. # 더블리 링크드 리스트의 노드 클래스 for Chaining class Node: def __init__(self, key, value): # 각 노드가 key, value를 갖는다 self.key = key self.value = value self.next = None self.prev = None # 더블리 링크드 리스트 클래스 for Chaining class LinkedList..
해시테이블이란? 해시테이블은 매우 빠른 평균 삽입, 삭제, 탐색연산을 제공하는 유용한 자료구조이다. 해시테이블은 데이터를 key - value 쌍으로 묶어 관리하는데, 국어사전이 낱말들을 적어놓은 방식과 유사하다. 국어사전에서 낱말을 찾아보면, 하나의 낱말에 하나 혹은 이상의 설명들이 적혀있다. 이 때, 낱말을 key, 그에 대한 설명을 value라고 비유할 수 있다. 실제로 파이썬에서 제공하는 dictionary 자료가 대표적인 해시테이블 기반의 자료라고 할 수 있다. 해시테이블의 데이터 저장 방법 해시테이블은 일반적인 배열과는 다르게 자료들을 순차적으로 저장하는 것이 아닌 key값을 인덱스로 저장한다. 예컨대, key가 201503196에 value가 "홍길동"인 데이터를 저장하고자 한다면 0 ~ 2..
더블리 링크드 리스트는 링크드 리스트와 다르게 노드 안에 data와 다음 노드에 대한 정보, 그리고 이전 노드에 대한 정보를 가진다. 따라서 특정 노드를 탐색하거나 리스트 크기를 구할 때는 일반적인 링크드 리스트와 동일한 메서드를 사용할 수 있지만, 노드를 정의할 때와 삽입 및 제거 연산을 해줄 때는 약간은 다른 방식이 필요하다. 먼저, 더블리 링크드 리스트의 노드는 다음과 같다. # 더블리 링크드 리스트의 노드 클래스 class Node: def __init__(self, data): self.data = data self.next = None self.prev = None # 이전 노드에 대한 정보도 저장해준다. 더블리 링크드 리스트의 연산 (삽입, 삭제) 링크드 리스트와는 다르게, 특정 데이터가 삽..