什麼是競爭性學習？

urrifat77 · Post by **urrifat77** » Tue Dec 03, 2024 9:07 am

競爭性學習是機器學習的子集，屬於無監督學習演算法的範疇。在競爭性學習中，人工神經元網路競爭「激發」或響應特定輸入而變得活躍。然後，「獲勝」神經元（通常是與給定輸入最匹配的神經元）被更新，而其他神經元保持不變。這種學習方法的重要性在於它能夠自動對相似的資料輸入進行聚類，使我們能夠在沒有給出先驗知識或標籤的情況下找到資料中的模式和分組。

競爭性學習解釋
人工神經網路通常利用競爭學習模型對輸入進行分類，而不使阿根廷電話號碼列表用標記資料。這個過程從輸入向量（通常是資料集）開始。然後將該輸入呈現給人工神經元網絡，每個神經元都有自己的一組權重，其作用類似於過濾器。每個神經元根據其權重和輸入向量計算分數，通常透過點積運算（一種將輸入資訊與濾波器相乘並將結果相加的方法）。

計算完成後，得分最高的神經元（「獲勝者」）通常會透過將其權重移至更接近輸入向量的方式進行更新。這個過程通常被稱為「贏者全拿」策略。隨著時間的推移，神經元會變得專業化，因為它們會向最匹配的輸入向量進行更新。這導致相似資料集群的形成，從而能夠發現輸入資料集中的固有模式。

為了說明如何使用競爭性學習，假設一家電子商務企業希望對其客戶群進行細分以進行有針對性的行銷，但他們沒有事先的標籤或細分。透過將客戶資料（購買歷史、瀏覽模式、人口統計等）輸入競爭性學習模型，他們可以自動找到不同的群體（如高消費者、頻繁購買者、折扣愛好者）並相應地定制行銷策略。

競爭性學習過程：一個循序漸進的例子
對於這個簡單的說明，我們假設我們有一個由 1 到 10 範圍內的一維輸入向量組成的資料集和一個具有兩個神經元的競爭學習網路。

第 1 步：初始化
我們首先將兩個神經元的權重初始化為隨機值。我們假設：

神經元 1 權重：2
神經元 2 權重：8
第 2 步：呈現輸入向量
現在，我們向網路提供一個輸入向量。假設我們的輸入向量是“5”。

第三步：計算距離
我們計算輸入向量和兩個神經元權重之間的距離。權重最接近輸入向量的神經元「獲勝」。這可以使用任何距離度量來計算，例如絕對差：

神經元 1 距離：|5-2| = 3
神經元2距離：|5-8| = 3
由於兩個距離相等，我們可以隨機選擇獲勝者。假設 Neuron 1 是獲勝者。

第 4 步：更新權重
我們調整獲勝神經元的權重，使其更接近輸入向量。如果我們的學習率（最佳化演算法中的調整參數，用於確定每次迭代的步長）為 0.5，則權重更新將為：

神經元1權重：2 + 0.5*(5-2) = 3.5
神經元 2 權重：8（不變）
第五步：迭代
我們對資料集中的所有其他輸入向量重複此過程，在每次呈現後更新權重。

第 6 步：收斂
經過幾次迭代（也稱為迭代）後，神經元的權重將開始收斂到其對應輸入簇的中心。在這種情況下，對於範圍從1 到10 的一維數據，我們可以預期一個神經元會在較低範圍（1 到5）周圍收斂，而另一個神經元會在較高範圍（6 到10 ）周圍收斂。

這個過程體現了競爭性學習的運作方式。隨著時間的推移，每個神經元專門研究不同的資料集群，使系統能夠識別和表示資料集中的固有分組。

競爭性學習與其他學習模式
與其他無監督學習模型（例如分層聚類和基於密度的雜訊應用空間聚類（DBSCAN））相比，競爭性學習的獨特優勢和限制變得顯而易見。

學習模式

集群結構

簇數

噪音處理

簇形狀

數據點的重新分配

競爭學習

平坦的

預定義（基於神經元數量）

有彈性，但無法區分雜訊和非雜訊數據

通常是凸的

數據點一旦分配就固定

層次聚類

分層（樹狀）

事後分析確定

取決於具體實施

通常是凸的

資料點可以重新分配為樹狀結構形式

資料庫掃描

平坦的

根據數據密度自動決定

非常好，將雜訊與非雜訊資料分開

任意（包括非凸）

數據點一旦分配就固定