23-05-31

지역해에 조기수렴하는 문제를 줄이기 위해 일정 비율을 전역해에서 반대 방향의 1/2 만큼 속도를 가지도록 조정
2025-12-20 04:50:45 +09:00 · 2023-05-31 19:57:55 +09:00
parent 8012cf3557
commit 89449048c4
6 changed files with 62 additions and 67 deletions
--- a/readme.md
+++ b/readme.md
@@ -13,12 +13,15 @@ pso 알고리즘을 사용하여 새로운 학습 방법을 찾는중 입니다

 다음 위치를 구하는 수식입니다

-> $$p_{id(t+1)} = \begin{cases} 
-x_{id(t+1)} & \text{if } f(x_{id(t+1)}) < f(p_{id(t)}) 
-\\ p_{id(t)} & \text{otherwise} 
-\end{cases}$$
+> $$
+p_{id(t+1)} =
+\begin{cases}
+x_{id(t+1)} & \text{if } f(x_{id(t+1)}) < f(p_{id(t)})\\
+p_{id(t)} & \text{otherwise}
+\end{cases}
+$$

-### 위치를 가장 최적값으로 변경(덮어쓰기)하면 안되는 이유
+### 위치를 현재 전역해로 변경(덮어쓰기)하면 안되는 이유

 위치를 가장 최적값으로 변경하면 지역 최적값에서 벗어나지 못합니다. 따라서 전역 최적값을 찾을 수 없습니다.

@@ -26,56 +29,65 @@ x_{id(t+1)} & \text{if } f(x_{id(t+1)}) < f(p_{id(t)})

 ## 1. PSO 알고리즘 구현

+### 파일 구조
+
 ```plain text
 |-- metacode   # pso 기본 코드
+|  |-- pso_bp.py # 오차역전파 함수를 최적화하는 PSO 알고리즘 구현 - 성능이 99% 이상으로 나오나 목적과 다름
+|  |-- pso_meta.py # PSO 기본 알고리즘 구현
+|  |-- pso_tf.py # tensorflow 모델을 이용가능한 PSO 알고리즘 구현
 |-- pso        # tensorflow 모델을 학습하기 위해 기본 pso 코드에서 수정 - (psokeras 코드 의 구조를 사용하여 만듬)
+|  |-- __init__.py  # pso 모듈을 사용하기 위한 초기화 파일
+|  |-- optimizer.py # pso 알고리즘 이용을 위한 기본 코드
+|  |-- particle.py  # 각 파티클의 정보 및 위치를 저장하는 코드
 |-- psokeras   # keras 모델을 이용가능한 PSO 알고리즘 - 다른 사람의 코드
+|  |-- ***
 |-- pyswarms   # pyswarms 라이브러리를 이용가능한 PSO 알고리즘 - 다른 사람의 코드
+|  |-- ***
 |-- examples.py # psokeras 코드를 이용한 예제
 |-- iris.py    # pso 코드를 이용한 iris 문제 풀이
 |-- mnist.py   # pso 코드를 이용한 mnist 문제 풀이
 |-- xor.ipynb     # pso 코드를 이용한 xor 문제 풀이
 |-- plt.ipynb     # pyplot 으로 학습 결과를 그래프로 표현
-
-pso_meta.py  # PSO 알고리즘 구현
-pso_tf.py # tensorflow 모델을 이용가능한 PSO 알고리즘 구현
-pso_bp.py # 오차역전파 함수를 최적화하는 PSO 알고리즘 구현 - 성능이 99% 이상으로 나오나 목적과 다름
-pso_tuning.py # pso 알고리즘의 하이퍼 파라미터를 자동으로 튜닝하는 파일
-
-xor.ipynb # xor 문제를 pso 알고리즘으로 풀이
-iris.ipynb # iris 문제를 pso 알고리즘으로 풀이
-mnist.ipynb # mnist 문제를 pso 알고리즘으로 풀이
-mnist.py # mnist 문제를 pso 알고리즘으로 풀이 - shell 실행용
 ```

+psokeras 및 pyswarms 라이브러리는 외부 라이브러리이기에 코드를 수정하지 않았습니다
+
+pso 라이브러리는 tensorflow 모델을 학습하기 위해 기본 ./metacode/pso_meta.py 코드에서 수정하였습니다
+
 ## 2. PSO 알고리즘을 이용한 최적화 문제 풀이

 pso 알고리즘을 이용하여 오차역전파 함수를 최적화 하는 방법을 찾는 중입니다

-### 임시 아이디어
+### 브레인스토밍

-1. 오차역전파 함수를 1~5회 실행하여 오차를 구합니다
-2. 오차가 가장 적은 다른 노드(particle) 가중치로 유도합니다.
+> 1. 오차역전파 함수를 1~5회 실행하여 오차를 구합니다
+> 2. 오차가 가장 적은 다른 노드(particle) 가중치로 유도합니다.
+>
+>> 2-1. 만약 오차가 가장 작은 다른 노드가 현재 노드보다 오차가 크다면, 현재 노드의 가중치를 유지합니다. - 현재의 가중치를 최적값으로 업로드합니다
+>>
+>> 2-2. 지역 최적값을 찾았다면, 전역 최적값을 찾을 때까지 1~2 과정을 반복합니다
+>
+> 3. 전역 최적값이 특정 임계치에서 변화율이 적다면 학습을 종료합니다 - 현재 결과가 정확도가 높지 않아서 이 기능은 추후에 추가할 예정입니다

-   2-1. 만약 오차가 가장 작은 다른 노드가 현재 노드보다 오차가 크다면, 현재 노드의 가중치를 유지합니다. - 현재의 가중치를 최적값으로 업로드합니다
+<br>
+위의 아이디어는 원래의 목표와 다른 방향으로 가고 있습니다. 따라서 다른 방법을 모색해야할 것 같습니다
+<br><br>

-   2-2. 지역 최적값을 찾았다면, 전역 최적값을 찾을 때까지 1~2 과정을 반복합니다
+### Trouble Shooting

-3. 전역 최적값이 특정 임계치에서 변화율이 적다면 학습을 종료합니다 - 현재 결과가 정확도가 높지 않아서 이 기능은 추후에 추가할 예정입니다
-
-### 현재 문제
-
-> 딥러닝 알고리즘 특성상 weights는 처음 컴파일시 무작위하게 생성된다. weights의 각 지점의 중요도는 매번 무작위로 정해지기에 전역 최적값으로 찾아갈 때 값이 높은 loss를 향해서 상승하는 현상이 나타난다.
-> <br>
+> 1. 딥러닝 알고리즘 특성상 weights는 처음 컴파일시 무작위하게 생성된다. weights의 각 지점의 중요도는 매번 무작위로 정해지기에 전역 최적값으로 찾아갈 때 값이 높은 loss를 향해서 상승하는 현상이 나타난다.<br>
 > 따라서 weights의 이동 방법을 더 탐구하거나, weights를 초기화 할때 random 중요도를 좀더 노이즈가 적게 생성하는 방향을 모색해야할 것 같다.

+-> 고르게 초기화 하기 위해 np.random.uniform 함수를 사용하였습니다
+
+> 2. 지역최적값에 계속 머무르는 조기 수렴 현상이 나타난다. - 30% 정도의 정확도를 가진다
+
 ### 개인적인 생각

 > 머신러닝 분류 방식에 존재하는 random forest 방식을 이용하여, 오차역전파 함수를 최적화 하는 방법이 있을것 같습니다
-> <br>
 >
 > > pso 와 random forest 방식이 매우 유사하다고 생각하여 학습할 때 뿐만 아니라 예측 할 때도 이러한 방식으로 사용할 수 있을 것 같습니다

-
 이곳의 코드를 참고하여 좀더 효율적인 코드로 수정하였습니다
-> https://github.com/mike-holcomb/PSOkeras
+> <https://github.com/mike-holcomb/PSOkeras>