기본 콘텐츠로 건너뛰기

인공지능의 기초 - 휴리스틱 탐색

Informed(Heuristic) Search

문제에 추가적으로 주어진 휴리스틱 정보(Heuristic information) 활용하여
각 노드의 평가함수(Evaluation function)를 만들고 그에 따라 확장우선순위를 두는 Tree Search 전략이다.

휴리스틱(Heuristic)

불충분한 시간, 정보로 인해 합리적인 판단이 불가능 할때, 과거의 경험이나 사회적 통념 등을 활용한 직관적판단을 하는 간편 추론법. 이때, 즉각적인 판단 기준이 되는 정보가 휴리스틱 정보(Heuristic Information)

휴리스틱 함수(Heuristic function), f(n)

휴리스틱 정보를 이용해 노드 n부터 목표노드까지의 최소경로비용의 예상치를 정의한 함수.

평가함수(Evaluation function), f(n)

출발노드로부터 노드 n을 거쳐서 목표노드까지 가는 최소경로비용에 대한 예측치를 정의한 함수.


대표적인 Informed Search 전략들

  • Greedy best-first search
  • A* search

Greedy best-first search

어떤 프린지 노드가 목표노드까지 가장 최소경로비용을 가질까?

평가함수 : f(n) = h(n)

장점 : 해를 가장 빠르게 구할수 있다.

단점 : Optimality를 보장 못한다.

-> 두가지 이유가 있다.

1. 휴리스틱 함수값과 실제 최소경로비용과의 차이
휴리스틱이 알려주는 예상값의 우선순위가 실제 경로비용값 우선순위와 다르다면 최적해를 찾아가기는 더욱 힘들어진다.

2. 평가함수에 해당 노드까지의 경로비용이 무시되어있다.
서로다른 프린지 노드까지의 경로비용의 차이가 휴리스틱으로 무시 못 할만큼 크다면 휴리스틱으로 만든 우선순의는 의미가 없어진다.

-> 그렇다면 어떤 조건에서 Optimality를 보장할까?

1. 휴리스틱 함수의 예측값 = 실제값.

우선, 적어도 휴리스틱 함수값이 실제 최소경로비용과 일치시켜야 겠다.

자, 모든 노드의 휴리스틱 함수값이 실제 최소경로비용과 같은 문제에서 어느 시점에 프린지 노드 n이 확장되어졌다 하자.

⇒ 노드 n은 1개 이상의 다른 프린지노드 q와 f(q) ≧ f(n)를 만족하거나, 유일한 프린지 노드이다.
⇒ n부터 f(n)을 지불해 목표노드에 도달가능함.
(∵ n으로 부터 도달 가능하지 않다면, 목표노드까지의 경로조차 없는데 실제 최소경로비용이 존재한다는 모순이 생긴다.)
⇒ n은 목표노드이거나 1개 이상의 자식노드 m 생성할것이다.
⇒ Step cost는 0이상 이므로, f(n) ≧ f(m) 이다.
⇒ q가 존재한다면, f(q) ≧ f(n) ≧ f(m) ⇒ f(q) ≧ f(m)이다.
⇒ q가 존재하면 f(q) ≧ f(m)이므로 다음에 m이 확장되고, 존재하지 않는다면 프린지 큐에 m밖에 없으므로 m 중 하나가 확장되게 된다.

∴  확장된 각 노드는 자신의 자식노드로만 확장하게된다.

귀납적으로, 휴리스틱 함수값이 실제값과 같을때, 확장은 시작노드부터 목표노드까지 자신의 자식노드로만 이루어지게 되어서, 목표노드까지 도달할때까지 오로지 보다 깊은 레벨로만 확장해나가게 된다.

2. step cost가 모두 일치.

휴리스틱 함수값이 실제값과 같아도 올바른 판단을 할 수 없는것은 그 노드까지의 경로비용을 고려하지 않아서인데, 이제는 형제노드끼리만 비교하면 된다. 즉, step cost의 차이를 반영 안해도 판단오류가 없게만 하면 된다.
 
이제, 어떤 문제에서 휴리스틱 함수값이 실제값과 같고, 실제 최소비용경로상의 2개이상의 자식노드를 가진 노드 n이 있다고 하자.

그렇다면, n의 자식노드중 임의의 서로다른 노드인 m과 k에대해 다음이 성립한다.

1. { R(m) ≦ R(k) } ⇔ { f(m) + S(m) + f(n) ≦ f(k) + S(k) + f(n) }
(R(x)는 출발노드부터 노드 x를 거쳐서 목표노드까지 가는데 드는 실제 최소경로비용, S(x)은 노드 x로 뻗어있는 에지의 step cost)
2. { S(m) - S(k) ≦  f(k) -  f(m)  }   { R(m) ≦ R(k) }, from 1.
3. ¬{ R(m) ≦ R(k) } ⇔ ¬{ f(m) + S(m) + f(n) ≦ f(k) + S(k) + f(n) }, from 1.
4. { R(m) > R(k) } ⇔ { f(m) + S(m) + f(n) > f(k) + S(k) + f(n) }, from 3
5. { S(m) - S(k) > f(k) -  f(m) }   { R(m) > R(k) }, from 4.

∴  S(m) - S(k)와 f(k) - f(m)의 대소관계가 R(m)과 R(k)의 대소관계와 같다.

그렇다면, 휴리스틱 함수값이 실제값과 같을때 부모노드가 최소비용경로상에 있고 형제노드가 하나이상 있는 어떤 노드 A가 있다고 하면, A가 다음을 만족할때 최소비용경로를 벗어나게 된다.

[ ∀B, { f(A) ≦ f(B) }] ⋀ [ ∃B, { S(A) - S(B) > f(B) - f(A) } ]
(B는 A의 형제노드)

반면, 다음을 만족할때는 최소비용경로로 진행하게 한다.

[ ∀B, { f(A) ≦ f(B) }] ⋀ [ ∀B, { S(A) - S(B) ≦ f(B) - f(A) } ]
( ∵ [ ∀B, { S(A) - S(B) ≦ f(A) - f(B) } ] ⇒ [ ∀B, { R(A) ≦ R(B) } ])

이때, 모든 step cost가 같아져버리면,

1. ∀B, { S(B) - S(A) = 0 }
2. [ ∀B, { f(A) ≦ f(B) }]  [ ∀B, { f(A) - f(B) ≦ 0 }]
3. [ ∀B, { f(A) ≦ f(B) }]  [ ∀B, { f(A) - f(B) ≦ S(B) - S(A) }], from 1,2
4. [ ∀B, { f(A) ≦ f(B) }]  [ ∀B, { S(A) - S(B) ≦ f(B) - f(A) }], from 3
5. [ ∀B, { f(A) ≦ f(B) }] ⇒ [ ∀B, { f(A) ≦ f(B) }] ⋀ [ ∀B, { S(A) - S(B) ≦ f(B) - f(A) } ]

∴  모든 step cost가 같아지면, ∀B, { f(A) ≦ f(B) }를 만족하는 A에 대해, [ ∀B, { f(A) ≦ f(B) }] ⋀ [ ∀B, { S(A) - S(B) ≦ f(A) - f(B) } ]는 항상 참

따라서, 휴리스틱함수값이 실제값이고 step cost가 모두 같으면, 알고리즘은 최소비용경로로만 진행하게 된다.

A* Search

출발노드부터 어떤 프린지 노드를 통하는 경로가 목표노드까지 가장 최소경로비용을 가질까?

평가함수 : f(n) = g(n) + h(n)

g(n) : 출발노드로부터 노드 n까지의 실제 최소경로비용. 노드를 생성할 때마다 갱신해 나간다.

장점 : 대체로 Optimal한 해를 구한다.
-> 허용적 휴리스틱을 사용하는 경우, Optimality를 보장.

단점 : 그리디 알고리즘보다 느리고 자원 소모가 조금 더 있을수 있다.
-> g(n)을 유지하기위한 오버헤드가 발생.


허용적 휴리스틱(Admissible Heuristics)

항상 실제 최소경로비용이하의 예측치를 가지는 휴리스틱 함수.

왜 Admissible Heuristics을 사용하면 Optimality가 보장될까?

임의의 최적해가 아닌 목표노드 G₀이 막 Enqueue된 상황에서 다음이 성립하게 된다.
h(G₀)=0 , f(G₀) = g(G₀)

이때, 최적해인 G₁으로가는 프린지노드 N도 존재할거고 다음이 성립한다.
f(G₀) = g(G₀) > g(G₁) = f(G₁) ≧ f(N), ∵ g(G₁) - g(N) ≧ h(N)

따라서, 무조건 다음에는 노드 N이 확장되어진다.

결국, 최적해가 아닌 목표노드로는 확장할 수가 없어 결국 최적해를 구하게 된다.

댓글

이 블로그의 인기 게시물

윈도우 10 마우스(커서) 옆에 자꾸 Progress bar(진행중 아이콘)가 나타난다면

이 글은 윈도우10 사용자 중 자꾸만 마우스 커서 옆에 뭔가가 실행중이라고 진행 아이콘이 뜨는 사람에게 조그마한 희망을 주는 글 입니다. 또한 백그라운드에서 프로그램이 실행되는 경우는 아주 다양하니 이 글에서 제시하는 방법은 수많은 문제 중 한가지 문제의 해결책일 뿐임을 미리 알려드립니다. 본인은 원래 해당컴퓨터에서 바이러스에 걸릴만한 행위를 일체 하지않았다. 토렌트나 웹하드는 전혀 사용하지 않고 인터넷에서 파일도 대기업의 공인된 파일만 다운받아서 썼었다. 그러나 어느 날 부턴가 다음과 같은 현상이 발생하였다. 아무런 프로그램도 실행중이지 않지만 자꾸 마우스 아이콘에 실행중이라고 뜨는 문제였다. 이해를 돕기위한 삽화 나는 실행한 프로그램이 없지만 뭔가가 실행중이라는 것은 백그라운드 서비스가 원인이라는 것이다. 그렇다면 어떤 서비스가 다음과같은 현상을 야기했을까? 나는 작업관리자에서 의심가는 백그라운드 프로세스를 종료해보았다. 바로 vpwalletservice VP.Inc에서 배포한 프로그램이었다. 아니나 다를까 해당 프로세스를 삭제하자마자 현상은 사라졌다. 백그라운드 서비스인만큼 msconfig의 서비스 목록에서도 제거하였고 이제 확실히 이런 현상은 발생하지 않을 것이다. 해당 프로그램은 현재 여러 문제를 야기시키는 것으로 인터넷에서 유명하다. 얼마전에는 해당프로그램이 윈도우 부팅시에 start process as current user get session user token failed 메시지를 띄우게 만들어 부팅을 방해했던 문제도 직접 경험해 본적이있다. 이 경우에도 해결방법은 같다.

Cubase : Serum 사용법(1) : 소개와 오실레이터, 필터, 모듈레이터의 사용법

큐베이스 가상악기 Serum 사용법(1) Serum 소개와 오실레이터, 필터, 모듈레이터의 사용법 1. Serum 이란? 큐베이스에서 사용가능한 가상악기 VST 플러그인 형태로 나온 Software Synthesizer 이다. 사운드의 시각화가 잘 되어있는게 특징이며, 웨이브테이블을 통해 다체로운 사운드를 만들 수 있는게 특징이다. Serum 사용 화면. 2. Serum 의 구조 소프트웨어 신디사이저는 구조는 다음과 같고 Serum도 이러한 구조로 이루어져있다. 신디사이저의 구조 여기에서 각 모듈들이 하는 역활은 다음과 같다. 오실레이터 (Oscillator) : 소리를 발진 시킨다. 필터 (Filter) : 오실레이터로부터 받은 소리를 필터링 한다. 엠프 (Amp) : 필터를 거쳐온 소리를 증폭시켜서 최종적으로 출력한다. 모듈레이터 (Modulator) : 각 모듈(오실레이터, 필터, 엠프)에 ENV, LFO 신호를 줘서 변형을 준다. ENV (Envelope Generator) : ADSR의 패턴을 가지고 신디사이저의 모듈들을 컨트롤 할 수 있는 Envelope를 생성한다. 보통 키보드 게이트의 신호를 통해 작동되어 시간에 따라 변하는 전압(Envelope)을 생성한다. LFO (Low Frequency Oscillator) : 저주파 발진기로. 저주파 패턴을 만들어서 음성을 변조하는대 사용한다. 그리고 Serum에서 각 모듈의 위치는 다음과 같다. Serum의 모듈 위치 3. Serum 각 모듈별 사용법 - 오실레이터(Oscillator) 오실레이터에서 Osc A, B가 활성화 되어있다 오실레이터는 크게 Sub와 Noise, Osc A, Osc B로 이루어져 있다. Sub는 기본파형을 발생시킬수 있으며 Noise는 치지직거리는 배경 잡음을 발생시키고, Osc A와 B는 각각 웨이브테이블을 이용해 다양한 파형의 소리를 발진시킨다. 각 요소...

C++ 프로그래밍에서의 메모리 제한(C++)

Visual C++에서는 배열을 선언할때 매모리 제한으로 258257까지만 할당할 수 있다고 한다. 따라서, 1차원 배열은 [258257]이 최대이고 이차원 대략 [508][508] 삼차원은 대략 [63][63][63]까지 할당할 수 있다고한다. 그래서 직접해봤다. 다음 코드를 작성하면 이런 결과를 볼 수 있다. #include <iostream> using namespace std; int main() {  int a[258258];  cin >> a[0]; return 0; } Unhandled exception at 0x0F3B9B32 (ucrtbased.dll) in example1.exe: 0xC00000FD: Stack overflow (parameters: 0x00000001, 0x01042FF4). 오 정말로 스텍오버플로우가 발생한다!!! 이번엔, 배열을 258257까지 선언해보았다. #include <iostream> using namespace std; int main() {  int a[258257];  cin >> a[0];  return 0; } Unhandled exception at 0x770AFA6E (ntdll.dll) in example1.exe: 0xC00000FD: Stack overflow (parameters: 0x00000001, 0x00602F74). 어라????!! 대체 어디까지 줄여야 스택오버플로우가 안뜨나 해봤다. 그 크기는 항상 달랐다. 대략 250000이하부터 안전해 지는 거 같다. 왠만하면 배열을 100000이상으로 안쓰는게 좋겠다. 게다가 변수를 하나만 선언해 놓고 쓰는것도 아니니까 실질적으로 선언할 수 있는 많이 줄어들 것이다. Dev C++에선 그 크기가 약간 다른거 같다. Dev C++을 이용해본 결과 배열을 [519828]...