mirror of https://github.com/jung-geun/PSO.git synced 2026-02-04 10:59:06 +09:00

Go to file

jung-geun f32433d935 23-09-04

pypi 패키지 배포 테스트 6

2023-09-04 15:16:35 +09:00

.devcontainer

23-07-09

2023-07-09 00:36:02 +09:00

.github/workflows

23-09-04

2023-09-04 15:16:35 +09:00

.vscode

23-09-04

2023-09-04 14:07:22 +09:00

conda_env

23-07-18

2023-07-18 10:44:41 +09:00

example

Colaboratory를 통해 생성됨

2023-07-23 19:41:15 +09:00

history_plt

23-08-06

2023-08-06 19:14:44 +09:00

metacode

23-07-13

2023-07-13 21:39:40 +09:00

pso

23-09-04

2023-09-04 14:45:45 +09:00

.gitignore

23-09-04

2023-09-04 15:02:33 +09:00

iris_tf.py

23-07-07

2023-07-07 18:30:08 +09:00

iris.py

23-08-06

2023-08-06 19:14:44 +09:00

LICENSE

Create LICENSE

2023-07-27 18:33:12 +09:00

mnist_tf.py

23-08-06

2023-08-06 19:14:44 +09:00

mnist.py

23-09-04

2023-09-04 14:07:22 +09:00

README.md

23-09-04

2023-09-04 14:07:22 +09:00

requirements.txt

23-09-04

2023-09-04 15:08:59 +09:00

setup.py

23-09-04

2023-09-04 15:16:35 +09:00

test01.py

23-08-06

2023-08-06 19:14:44 +09:00

xor.py

23-08-06

2023-08-06 19:14:44 +09:00

README.md

PSO 알고리즘 구현 및 새로운 시도

pso 알고리즘을 사용하여 새로운 학습 방법을 찾는중 입니다
병렬처리로 사용하는 논문을 찾아보았지만 이보다 더 좋은 방법이 있을 것 같아서 찾아보고 있습니다 - [1]

기본 pso 알고리즘의 속도를 구하는 수식은 다음과 같습니다

V_{t+1} = W_t + c_1 * r_1 * (Pbest_t - x_t) + c_2 * r_2 * (Gbest_t - x_t)

다음 위치를 업데이트하는 수식입니다

x_{t+1} = x_{t} + V_{t+1}

다음과 같은 변수를 사용합니다

$Pbest_t : 각 파티클의 지역 최적해$
$Gbest_t : 전역 최적해$
$W_t : 가중치$
$c_1, c_2 : 파라미터$
$r_1, r_2 : 랜덤 값$
$x_t : 현재 위치$
$V_{(t+1)} : 다음 속도$

pso 알고리즘을 이용하여 keras 모델을 학습하는 방법을 탐구하고 있습니다
현재는 xor, iris, mnist 문제를 풀어보았으며, xor 문제와 iris 문제는 100%의 정확도를 보이고 있습니다
mnist 문제는 63%의 정확도를 보이고 있습니다

xor
iris
mnist

초기 세팅 및 사용 방법

자동으로 conda 환경을 설정하기 위해서는 다음 명령어를 사용합니다

conda env create -f conda_env/environment.yaml

현재 python 3.9 버전, tensorflow 2.11 버전에서 테스트 되었습니다
직접 설치하여 사용할 경우 pso2keras 패키지를 pypi 에서 다운로드 받아서 사용하시기 바랍니다

pip install pso2keras

위의 패키지를 사용하기 위해서는 tensorflow 와 tensorboard 가 설치되어 있어야 합니다

python 패키지를 사용하기 위한 라이브러리는 아래 코드를 사용합니다

from pso import Optimizer

pso_model = Optimizer(...)
pso_model.fit(...)

구조 및 작동 방식

파일 구조

|-- /conda_env              # conda 환경 설정 파일
|  |-- environment.yaml     # conda 환경 설정 파일
|-- /metacode               # pso 기본 코드
|  |-- pso_bp.py            # 오차역전파 함수를 최적화하는 PSO 알고리즘 구현 - 성능이 99% 이상으로 나오나 목적과 다름
|  |-- pso_meta.py          # PSO 기본 알고리즘 구현
|  |-- pso_tf.py            # tensorflow 모델을 이용가능한 PSO 알고리즘 구현
|-- /pso                    # tensorflow 모델을 학습하기 위해 기본 pso 코드에서 수정 - (psokeras 코드 의 구조를 사용하여 만듬)
|  |-- __init__.py          # pso 모듈을 사용하기 위한 초기화 파일
|  |-- optimizer.py         # pso 알고리즘 이용을 위한 기본 코드
|  |-- particle.py          # 각 파티클의 정보 및 위치를 저장하는 코드
|-- xor.py                  # pso 를 이용한 xor 문제 풀이
|-- iris.py                 # pso 를 이용한 iris 문제 풀이
|-- iris_tf.py              # tensorflow 를 이용한 iris 문제 풀이
|-- mnist.py                # pso 를 이용한 mnist 문제 풀이
|-- mnist_tf.py             # tensorflow 를 이용한 mnist 문제 풀이
|-- plt.ipynb               # pyplot 으로 학습 결과를 그래프로 표현
|-- README.md               # 현재 파일
|-- requirements.txt        # pypi 에서 다운로드 받을 패키지 목록

pso 라이브러리는 tensorflow 모델을 학습하기 위해 기본 ./metacode/pso_meta.py 코드에서 수정하였습니다 [2]

pso 알고리즘을 이용하여 오차역전파 함수를 최적화 하는 방법을 찾는 중입니다

알고리즘 작동 방식

파티클의 위치와 속도를 초기화 한다.

각 파티클의 점수를 계산한다.

각 파티클의 지역 최적해와 전역 최적해를 구한다.

각 파티클의 속도를 업데이트 한다.

PSO 알고리즘을 이용하여 풀이한 문제들의 정확도

1. xor 문제

loss = 'mean_squared_error'

pso_xor = Optimizer(
    model,
    loss=loss,
    n_particles=50,
    c0=0.35,
    c1=0.8,
    w_min=0.6,
    w_max=1.2,
    negative_swarm=0.1,
    mutation_swarm=0.2,
    particle_min=-3,
    particle_max=3,
)

best_score = pso_xor.fit(
    x_test,
    y_test,
    epochs=200,
    save=True,
    save_path="./result/xor",
    renewal="acc",
    empirical_balance=False,
    Dispersion=False,
    check_point=25,
)

위의 파라미터 기준 10 세대 근처부터 정확도가 100%가 나오는 것을 확인하였습니다

2. iris 문제

loss = 'mean_squared_error'

pso_iris = Optimizer(
    model,
    loss=loss,
    n_particles=100,
    c0=0.35,
    c1=0.7,
    w_min=0.5,
    w_max=0.9,
    negative_swarm=0.1,
    mutation_swarm=0.2,
    particle_min=-3,
    particle_max=3,
)

best_score = pso_iris.fit(
    x_train,
    y_train,
    epochs=200,
    save=True,
    save_path="./result/iris",
    renewal="acc",
    empirical_balance=False,
    Dispersion=False,
    check_point=25
)

위의 파라미터 기준 7 세대에 97%, 35 세대에 99.16%의 정확도를 보였습니다

위의 그래프를 보면 epochs 이 늘어나도 정확도와 loss 가 수렴하지 않는것을 보면 파라미터의 이동 속도가 너무 빠르다고 생각합니다

3. mnist 문제

loss = 'mean_squared_error'

pso_mnist = Optimizer(
    model,
    loss=loss,
    n_particles=500,
    c0= 0.4,
    c1= 0.6,
    w_min= 0.5,
    w_max= 0.8,
    negative_swarm=0.1,
    mutation_swarm=0.2,
    particle_min=-5,
    particle_max=5,
)

best_score = pso_mnist.fit(
    x_train,
    y_train,
    epochs=200,
    save_info=True,
    log=2,
    log_name="mnist",
    save_path="./result/mnist",
    renewal="acc",
    check_point=25,
)

위의 파라미터 기준 현재 정확도 63.84%를 보이고 있습니다

63%의 정확도가 나타나는 것으로 보아 최적화가 되어가고 있다고 볼 수 있을 것 같습니다. 하지만 정확도가 더 이상 올라가지 않고 정체되는 것으로 보아 조기 수렴하는 문제가 발생하고 있다고 생각합니다.

Trouble Shooting

딥러닝 알고리즘 특성상 weights는 처음 컴파일시 무작위하게 생성된다. weights의 각 지점의 중요도는 매번 무작위로 정해지기에 전역 최적값으로 찾아갈 때 값이 높은 loss를 향해서 상승하는 현상이 나타난다.
따라서 weights의 이동 방법을 더 탐구하거나, weights를 초기화 할때 random 중요도를 좀더 노이즈가 적게 생성하는 방향을 모색해야할 것 같다.

-> 고르게 초기화 하기 위해 np.random.uniform 함수를 사용하였습니다

지역최적값에 계속 머무르는 조기 수렴 현상이 나타난다. - 30% 정도의 정확도를 가진다

-> 지역최적값에 머무르는 것을 방지하기 위해 negative_swarm, mutation_swarm 파라미터를 추가하였습니다 - 현재 63% 정도의 정확도를 보이고 있습니다

파티클의 수를 늘리면 전역 최적해에 좀더 가까워지는 현상을 발견하였다. 하지만 파티클의 수를 늘리면 메모리 사용량이 기하급수적으로 늘어난다.

-> keras 모델을 사용할때 predict, evaluate 함수를 사용하면 메모리 누수가 발생하는 문제를 찾았습니다. 해결방법을 추가로 찾아보는중 입니다. -> 메모리 누수를 획기적으로 줄여 현재는 파티클의 수를 500개에서 1000개까지 증가시켜도 문제가 없습니다.
-> 추가로 파티클의 수가 적을때에도 전역 최적해를 쉽게 찾는 방법을 찾는중 입니다

현재 tensorboard 로 로그 저장시 994개 이상 저장이 안되는 문제가 발생하고 있습니다.

-> csv 파일로 저장할 경우 갯수에는 문제가 발생하지 않습니다. -> 수가 적을때 한 파티클이 지역 최적해에서 머무를 경우 파티클을 초기화 하는 방법이 필요해 보입니다.

모델의 크기가 커지면 수렴이 늦어지고 정확도가 떨어지는 현상이 발견되었다. 모델의 크기에 맞는 파라미터를 찾아야할 것 같다.

EBPSO 의 방식을 추가로 적용을 하였으나 수식을 잘못 적용을 한것인지 기본 pso 보다 더 떨어지는 정확도를 보이고 있다. (현재 수정중)

개인적인 생각

머신러닝 분류 방식에 존재하는 random forest 방식을 이용하여, 오차역전파 함수를 최적화 하는 방법이 있을것 같습니다

pso 와 random forest 방식이 매우 유사하다고 생각하여 학습할 때 뿐만 아니라 예측 할 때도 이러한 방식으로 사용할 수 있을 것 같습니다

참고 자료

[1]: A partilce swarm optimization algorithm with empirical balance stategy
[2]: psokeras
[3]: PSO의 다양한 영역 탐색과 지역적 미니멈 인식을 위한 전략
[4]: PC 클러스터 기반의 Multi-HPSO를 이용한 안전도 제약의 경제 급전
[5]: Particle 2-Swarm Optimization for Robust Search

README.md

목차

PSO 알고리즘 구현 및 새로운 시도

초기 세팅 및 사용 방법

구조 및 작동 방식

파일 구조

알고리즘 작동 방식

PSO 알고리즘을 이용하여 풀이한 문제들의 정확도

1. xor 문제

2. iris 문제

3. mnist 문제

Trouble Shooting

개인적인 생각

참고 자료