23-07-12

xor iris 수치 교정 파티클의 분포 조정 가능하게 수정 random 시드 추출
2026-02-04 10:59:06 +09:00 · 2023-07-12 05:03:18 +09:00
parent 2b010c4257
commit 7d22ededc7
19 changed files with 201 additions and 280 deletions
--- a/.gitignore
+++ b/.gitignore
@@ -5,12 +5,14 @@ __pycache__/
 .ipynb_checkpoints/
 # 테스트용 파일
 test.ipynb
 # 결과 저장용 디렉토리
 result/
 # 논문 관련 파일
 *.pdf
 *.pptx
 관련 논문/
 발표 자료/
--- a/.vscode/settings.json
+++ b/.vscode/settings.json
@@ -1,5 +1,6 @@
 {
    "[python]": {
        "editor.defaultFormatter": "ms-python.black-formatter"
-    }
+    },
    "python.formatting.provider": "none"
 }
--- a/README.md
+++ b/README.md
@@ -28,7 +28,7 @@ pso 알고리즘을 사용하여 새로운 학습 방법을 찾는중 입니다
 # 초기 세팅
 ```shell
- conda env create -f env.yaml
+conda env create -f ./conda_env/environment.yaml
 ```
 # 현재 진행 상황
@@ -84,20 +84,23 @@ pso 알고리즘을 이용하여 오차역전파 함수를 최적화 하는 방
 ### 1. xor 문제
 ```python
- loss = 'mean_squared_error'
+loss = 'mean_squared_error'
- pso_xor = Optimizer(
+pso_xor = Optimizer(
    model,
    loss=loss,
-    n_particles=75,
+    n_particles=50,
    c0=0.35,
    c1=0.8,
    w_min=0.6,
    w_max=1.2,
-    negative_swarm=0.25
+    negative_swarm=0.1,
-    )
+    mutation_swarm=0.2,
    particle_min=-3,
    particle_max=3,
 )
- best_score = pso_xor.fit(
+best_score = pso_xor.fit(
    x_test,
    y_test,
    epochs=200,
@@ -106,27 +109,30 @@ pso 알고리즘을 이용하여 오차역전파 함수를 최적화 하는 방
    renewal="acc",
    empirical_balance=False,
    Dispersion=False,
-    check_point=25
+    check_point=25,
-    )
+)
 ```
-위의 파라미터 기준 40 세대 이후부터 정확도가 100%가 나오는 것을 확인하였습니다
+위의 파라미터 기준 10 세대 근처부터 정확도가 100%가 나오는 것을 확인하였습니다
-![xor](./history_plt/xor_sigmoid_2_acc_40.png)
+![xor](./history_plt/xor_2_10.png)
 2. iris 문제
 ```python
-loss = 'categorical_crossentropy'
+loss = 'mean_squared_error'
 pso_iris = Optimizer(
    model,
    loss=loss,
-    n_particles=50,
+    n_particles=100,
    c0=0.4,
    c1=0.8,
    w_min=0.7,
    w_max=1.0,
-    negative_swarm=0.2
+    negative_swarm=0.1,
    mutation_swarm=0.2,
    particle_min=-3,
    particle_max=3,
    )
 best_score = pso_iris.fit(
@@ -148,7 +154,7 @@ best_score = pso_iris.fit(
 3. mnist 문제
 ```python
-loss = 'mse'
+loss = 'mean_squared_error'
 pso_mnist = Optimizer(
    model,
--- a/auto_tunning.py
+++ b/auto_tunning.py
@@ -1,134 +0,0 @@
 # %%
 import os
 os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"
 import tensorflow as tf
 tf.random.set_seed(777)  # for reproducibility
 import gc
 from datetime import date
 import numpy as np
 from keras import backend as K
 from keras.datasets import mnist
 from keras.layers import Conv2D, Dense, Dropout, Flatten, MaxPooling2D
 from keras.models import Sequential
 from tensorflow import keras
 from tqdm import tqdm
 from pso import Optimizer
 def get_data():
    (x_train, y_train), (x_test, y_test) = mnist.load_data()
    x_train, x_test = x_train / 255.0, x_test / 255.0
    x_train = x_train.reshape((60000, 28, 28, 1))
    x_test = x_test.reshape((10000, 28, 28, 1))
    print(f"x_train : {x_train[0].shape} | y_train : {y_train[0].shape}")
    print(f"x_test : {x_test[0].shape} | y_test : {y_test[0].shape}")
    return x_train, y_train, x_test, y_test
 def get_data_test():
    (x_train, y_train), (x_test, y_test) = mnist.load_data()
    x_test = x_test.reshape((10000, 28, 28, 1))
    return x_test, y_test
 def make_model():
    model = Sequential()
    model.add(
        Conv2D(32, kernel_size=(5, 5), activation="relu", input_shape=(28, 28, 1))
    )
    model.add(MaxPooling2D(pool_size=(3, 3)))
    model.add(Conv2D(64, kernel_size=(3, 3), activation="relu"))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))
    model.add(Flatten())
    model.add(Dense(128, activation="relu"))
    model.add(Dense(10, activation="softmax"))
    return model
 # %%
 model = make_model()
 x_test, y_test = get_data_test()
 # loss = 'binary_crossentropy'
 # loss = 'categorical_crossentropy'
 # loss = 'sparse_categorical_crossentropy'
 # loss = 'kullback_leibler_divergence'
 # loss = 'poisson'
 # loss = 'cosine_similarity'
 # loss = 'log_cosh'
 # loss = 'huber_loss'
 # loss = 'mean_absolute_error'
 # loss = 'mean_absolute_percentage_error'
 # loss = 'mean_squared_error'
 loss = [
    "mse",
    "categorical_crossentropy",
    "binary_crossentropy",
    "kullback_leibler_divergence",
    "poisson",
    "cosine_similarity",
    "log_cosh",
    "huber_loss",
    "mean_absolute_error",
    "mean_absolute_percentage_error",
 ]
 n_particles = [50, 75, 100]
 c0 = [0.25, 0.35, 0.45, 0.55]
 c1 = [0.5, 0.6, 0.7, 0.8, 0.9]
 w_min = [0.5, 0.6, 0.7]
 w_max = [1.1, 1.2, 1.3]
 negative_swarm = [0.25, 0.3, 0.5]
 eb = [True, False]
 dispersion = [True, False]
 if __name__ == "__main__":
    try:
        for loss_ in loss:
            for n in n_particles:
                for c_0 in c0:
                    for c_1 in c1:
                        for w_m in w_min:
                            for w_M in w_max:
                                for n_s in negative_swarm:
                                    pso_mnist = Optimizer(
                                        model,
                                        loss=loss_,
                                        n_particles=n,
                                        c0=c_0,
                                        c1=c_1,
                                        w_min=w_m,
                                        w_max=w_M,
                                        negative_swarm=n_s,
                                    )
                                    best_score = pso_mnist.fit(
                                        x_test,
                                        y_test,
                                        epochs=200,
                                        save=True,
                                        save_path="./result/mnist",
                                        renewal="acc",
                                        empirical_balance=False,
                                        Dispersion=False,
                                        check_point=25,
                                    )
                                    del pso_mnist
                                    gc.collect()
                                    tf.keras.backend.clear_session()
    except KeyboardInterrupt:
        print("KeyboardInterrupt")
    finally:
        print("Finish")
--- a/conda_env/environment.yaml
+++ b/conda_env/environment.yaml
--- a/example.py
+++ b/example.py
@@ -1,104 +0,0 @@
 """
 example.py
 Demonstrates usage of PSOkeras module by training dense Keras model for classifying Iris data set.  Also compares
 results with a number of independent runs of standard Backpropagation algorithm (Adam) equal to the particle count.
@author Mike Holcomb (mjh170630@utdallas.edu)
 """
 import tensorflow as tf
 from sklearn.datasets import load_iris
 from sklearn.model_selection import train_test_split
 from tensorflow import keras
 from tensorflow.keras.layers import Dense
 from tensorflow.keras.models import Sequential
 from psokeras import Optimizer
 N = 50  # number of particles
 STEPS = 500  # number of steps
 LOSS = "mse"  # Loss function
 BATCH_SIZE = 32  # Size of batches to train on
 def build_model(loss):
    """
    Builds test Keras model for predicting Iris classifications
    :param loss (str): Type of loss - must be one of Keras accepted keras losses
    :return: Keras dense model of predefined structure
    """
    model = Sequential()
    model.add(Dense(4, activation="sigmoid", input_dim=4, use_bias=True))
    model.add(Dense(4, activation="sigmoid", use_bias=True))
    model.add(Dense(3, activation="softmax", use_bias=True))
    model.compile(loss=loss, optimizer="adam")
    return model
 def vanilla_backpropagation(x_train, y_train):
    """
    Runs N number of backpropagation model training simulations
    :param x_train: x values to train on
    :param y_train: target labels to train with
    :return: best model run as measured by LOSS
    """
    best_model = None
    best_score = 100.0
    for i in range(N):
        model_s = build_model(LOSS)
        model_s.fit(x_train, y_train, epochs=STEPS, batch_size=BATCH_SIZE, verbose=0)
        train_score = model_s.evaluate(
            x_train, y_train, batch_size=BATCH_SIZE, verbose=0
        )
        if train_score < best_score:
            best_model = model_s
            best_score = train_score
    return best_model
 if __name__ == "__main__":
    # Section I: Build the data set
    iris = load_iris()
    x_train, x_test, y_train, y_test = train_test_split(
        iris.data,
        keras.utils.to_categorical(iris.target, num_classes=None),
        test_size=0.5,
        random_state=0,
        stratify=iris.target,
    )
    # Section II: First run the backpropagation simulation
    model_s = vanilla_backpropagation(x_train=x_train, y_train=y_train)
    b_train_score = model_s.evaluate(x_train, y_train, batch_size=BATCH_SIZE, verbose=0)
    b_test_score = model_s.evaluate(x_test, y_test, batch_size=BATCH_SIZE, verbose=0)
    print("Backprop -- train: {:.4f}  test: {:.4f}".format(b_train_score, b_test_score))
    # Section III: Then run the particle swarm optimization
    # First build model to train on (primarily used for structure, also included in swarm)
    model_p = build_model(LOSS)
    # Instantiate optimizer with model, loss function, and hyperparameters
    pso = Optimizer(
        model=model_p,
        loss=LOSS,
        n=N,  # Number of particles
        acceleration=1.0,  # Contribution of recursive particle velocity (acceleration)
        local_rate=0.6,  # Contribution of locally best weights to new velocity
        global_rate=0.4,  # Contribution of globally best weights to new velocity
    )
    # Train model on provided data
    pso.fit(x_train, y_train, steps=STEPS, batch_size=BATCH_SIZE)
    # Get a copy of the model with the globally best weights
    model_p = pso.get_best_model()
    p_train_score = model_p.evaluate(x_train, y_train, batch_size=BATCH_SIZE, verbose=0)
    p_test_score = model_p.evaluate(x_test, y_test, batch_size=BATCH_SIZE, verbose=0)
    print("PSO -- train: {:.4f}  test: {:.4f}".format(p_train_score, p_test_score))
--- a/history_plt/mnist_sparse_categorical_crossentropy_45.96.png
+++ b/history_plt/mnist_sparse_categorical_crossentropy_45.96.png
--- a/history_plt/mnist_sparse_categorical_crossentropy_46.57.png
+++ b/history_plt/mnist_sparse_categorical_crossentropy_46.57.png
--- a/history_plt/xor_2_10.png
+++ b/history_plt/xor_2_10.png
--- a/history_plt/xor_2_15.png
+++ b/history_plt/xor_2_15.png
--- a/iris.py
+++ b/iris.py
@@ -1,4 +1,5 @@
 import os
 import sys
 os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"
@@ -39,11 +40,11 @@ def load_data():
 model = make_model()
 x_train, x_test, y_train, y_test = load_data()
-loss = ["categorical_crossentropy"]
+loss = ["categorical_crossentropy", 'mean_squared_error']
 pso_iris = Optimizer(
    model,
-    loss=loss[0],
+    loss=loss[1],
    n_particles=100,
    c0=0.4,
    c1=0.8,
@@ -51,6 +52,8 @@ pso_iris = Optimizer(
    w_max=1.0,
    negative_swarm=0.1,
    mutation_swarm=0.2,
    particle_min=-3,
    particle_max=3,
 )
 best_score = pso_iris.fit(
@@ -66,3 +69,5 @@ best_score = pso_iris.fit(
 )
 gc.collect()
 print("Done!")
 sys.exit(0)
--- a/mnist.py
+++ b/mnist.py
@@ -1,20 +1,19 @@
 # %%
 import os
 import sys
 os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"
 import gc
 import tensorflow as tf
 from tensorflow import keras
 from keras.datasets import mnist
 from keras.layers import Conv2D, Dense, Dropout, Flatten, MaxPooling2D
 from keras.models import Sequential
 from tensorflow import keras
 from pso import Optimizer
 # from pso import Optimizer_Test
 def get_data():
    (x_train, y_train), (x_test, y_test) = mnist.load_data()
@@ -85,11 +84,11 @@ if __name__ == "__main__":
        pso_mnist = Optimizer(
            model,
            loss=loss[0],
-            n_particles=75,
+            n_particles=70,
            c0=0.25,
-            c1=0.4,
+            c1=0.45,
-            w_min=0.2,
+            w_min=0.35,
-            w_max=0.55,
+            w_max=0.6,
            negative_swarm=0.1,
            mutation_swarm=0.2,
        )
@@ -110,3 +109,5 @@ if __name__ == "__main__":
        print(e)
    finally:
        gc.collect()
        print("Done!")
        sys.exit(0)
--- a/plt.ipynb
+++ b/plt.ipynb
--- a/pso/init.py
+++ b/pso/init.py
@@ -1,8 +1,11 @@
 from .optimizer import Optimizer
 from .particle import Particle
-from .optimizer_target import Optimizer_Target
+# from .optimizer_target import Optimizer_Target
 __version__ = '0.1.0'
 __all__ = [
    'Optimizer',
    'Particle',
-    'Optimizer_Target'
+    # 'Optimizer_Target'
 ]
--- a/pso/optimizer.py
+++ b/pso/optimizer.py
@@ -41,6 +41,8 @@ class Optimizer:
        mutation_swarm: float = 0,
        np_seed: int = None,
        tf_seed: int = None,
        particle_min: float = -5,
        particle_max: float = 5,
    ):
        """
        particle swarm optimization
@@ -63,6 +65,8 @@ class Optimizer:
        if tf_seed is not None:
            tf.random.set_seed(tf_seed)
        self.random_state = np.random.get_state()
        self.model = model  # 모델 구조
        self.loss = loss  # 손실함수
        self.n_particles = n_particles  # 파티클 개수
@@ -82,6 +86,7 @@ class Optimizer:
        self.renewal = "acc"
        self.Dispersion = False
        self.day = datetime.now().strftime("%m-%d-%H-%M")
        self.empirical_balance = False
        negative_count = 0
@@ -89,7 +94,7 @@ class Optimizer:
            m = keras.models.model_from_json(model.to_json())
            init_weights = m.get_weights()
            w_, sh_, len_ = self._encode(init_weights)
-            w_ = np.random.uniform(-3, 3, len(w_))
+            w_ = np.random.uniform(particle_min, particle_max, len(w_))
            m.set_weights(self._decode(w_, sh_, len_))
            m.compile(loss=self.loss, optimizer="sgd", metrics=["accuracy"])
            self.particles[i] = Particle(
@@ -254,6 +259,7 @@ class Optimizer:
            elif renewal == "both":
                if local_score[1] > self.g_best_score[0]:
                    self.g_best_score[0] = local_score[1]
                    self.g_best_score[1] = local_score[0]
                    self.g_best = p.get_best_weights()
                    self.g_best_ = p.get_best_weights()
@@ -274,7 +280,6 @@ class Optimizer:
                    else:
                        f.write("\n")
                    f.close()
            del local_score
            gc.collect()
@@ -424,7 +429,6 @@ class Optimizer:
                                f.write(", ")
                            else:
                                f.write("\n")
                        f.close()
                if check_point is not None:
                    if epoch % check_point == 0:
@@ -498,6 +502,11 @@ class Optimizer:
            "Dispersion": self.Dispersion,
            "negative_swarm": self.negative_swarm,
            "mutation_swarm": self.mutation_swarm,
            "random_state_0": self.random_state[0],
            "random_state_1": self.random_state[1].tolist(),
            "random_state_2": self.random_state[2],
            "random_state_3": self.random_state[3],
            "random_state_4": self.random_state[4],
            "renewal": self.renewal,
        }
@@ -507,8 +516,6 @@ class Optimizer:
        ) as f:
            json.dump(json_save, f, indent=4)
        f.close()
    def _check_point_save(self, save_path: str = f"./result/check_point"):
        """
        중간 저장
--- a/requirements.txt
+++ b/requirements.txt
@@ -0,0 +1,7 @@
 ipython @ file:///home/conda/feedstock_root/build_artifacts/ipython_1680185408135/work
 keras==2.11.0
 matplotlib @ file:///croot/matplotlib-suite_1679593461707/work
 numpy @ file:///work/mkl/numpy_and_numpy_base_1682953417311/work
 pandas==1.5.3
 tensorflow==2.11.0
 tqdm @ file:///croot/tqdm_1679561862951/work
--- a/setup.py
+++ b/setup.py
@@ -0,0 +1,17 @@
 from setuptools import setup, find_packages
 setup(
    name='pso-keras',
    version='0.1.0',
    description='Particle Swarm Optimization to tensorflow package',
    author='pieroot',
    author_email='jgbong0306@gmail.com',
    url='https://github.com/jung-geun/PSO',
    install_requires=['tqdm', 'numpy', 'tensorflow', 'keras'],
    packages=find_packages(exclude=[]),
    keywords=['pso', 'tensorflow', 'keras'],
    python_requires='>=3.8',
    package_data={},
    zip_safe=False,
    long_description=open('README.md', encoding='UTF8').read(),
 )
--- a/weights.h5
+++ b/weights.h5
--- a/xor.py
+++ b/xor.py
@@ -1,5 +1,6 @@
 # %%
 import os
 import sys
 os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"
@@ -49,13 +50,15 @@ loss = [
 pso_xor = Optimizer(
    model,
    loss=loss[0],
-    n_particles=75,
+    n_particles=50,
    c0=0.35,
    c1=0.8,
    w_min=0.6,
    w_max=1.2,
-    negative_swarm=0.25,
+    negative_swarm=0.1,
-    mutation_swarm=0.25,
+    mutation_swarm=0.2,
    particle_min=-3,
    particle_max=3,
 )
 best_score = pso_xor.fit(
    x_test,
@@ -69,4 +72,6 @@ best_score = pso_xor.fit(
    check_point=25,
 )
 print("Done!")
 sys.exit(0)
 # %%