Đây là một thuật toán thuật toán phân cụm không giám sát SSFCM.
Size: 151.86 KB
Language: none
Added: Feb 21, 2025
Slides: 4 pages
Slide Content
1.Cấu trúc tổng thể của hàm mục tiêu
Hàm mục tiêu trong S2CFC được mô hình hóa:
Trong đó:
JUnsupervised[i] : Thành phần không giám sát giúp giảm khoảng cách giữa các điểm dữ
liệu và tâm cụm.
JSemi−supervised[i] : Thành phần bán giám sát giúp tích hợp thông tin từ dữ liệu có
nhãn.
JCollaborative[i,j] :Thành phần hợp tác giúp học cường độ hợp tác giữa các cụm từ các
site dữ liệu khác.
: Điều chỉnh tác động của semi-supervised learning:
Giá trị lớn -> phân cụm sẽ phụ thuộc nhiều hơn về dữ liệu có nhãn
Ngược lại sẽ tập trung nhiều vào dữ liệu không nhãn
2.Các thành phần của hàm mục tiêu và ý nghĩa
Chú thích chung:
+ ucn[i] : mức độ thành viên của dữ liệu thứ n đối với tâm cụm thứ c tại site dữ
liệu i
+ dcn[i] : khoảng cách giữa điểm dữ liệu thứ n và tâm cụm thứ c tại site dữ liệu i
+ C*: Số lượng cụm tổng thể trong toàn bộ hệ thống. Đây là số lượng cụm
chung được sử dụng trong tất cả các site dữ liệu
+ N*: Số lượng điểm dữ liệu tổng thể trên toàn bộ hệ thống (tất cả các site).
a.Thành phần không giám sát
??????: biểu thị mức độ của tác động giám sát, được định lượng bằng tỷ lệ của số
lượng đối tượng dữ liệu so với dữ liệu được gán nhãn
?????? > 0, tránh trường hợp phân cụm quá sắc nét
Mục tiêu: Giảm khoảng cách giữa dữ liệu và tâm cụm (term đầu) trong khi tối
đa hóa độ bất định của hàm thành viên (term thứ hai).
b.Thành phần bán giám sát
Mục tiêu: điều chỉnh kết quả phân cụm sao cho phù hợp với thông tin từ dữ
liệu nhãn, giúp phân cụm chính xác hơn bằng cách ràng buộc hàm thành viên
theo nhãn
c.Thành phần hợp tác
Chú thích:
+ : Hệ số điều chỉnh mức độ tin cậy của thông tin về site i
Nếu lớn -> site i tin tưởng vào thông tin của chính nó hơn
Ngược lại thì sẽ tin tưởng vào thông tin của site j hơn
+ : mức độ thành viên của dữ liệu được gán nhãn
+ β[i,j]: mức độ cộng tác giữa site i và site j
Gía trị lớn -> site i sẽ chịu ảnh hưởng hơn từ site j
Ngược lại -> site i ít bị ảnh hưởng bởi site j
+ δ
−1
: điều chỉnh mức độ ảnh hưởng của β[i,j]
Nếu δ nhỏ, thành phần này có tác động lớn, tức là mức độ cộng tác quan
trọng.
Nếu δ lớn, nó ít quan trọng hơn.
Giảm thiểu ln β[i,j] giúp các site tiến đồng cộng tác trong quá trình phân
cụm
Mục tiêu: tối ưu hóa sự hợp tác giữa các cụm khác nhau thông qua điều chỉnh
mức độ hợp tác
3.Các ràng buộc và tác động
(13: Đảm bảo rằng tổng của tất cả các giá trị hàm thành viên nằm trong một giới hạn hợp lý.
14: mức độ thành viên của dữ liệu thứ n đối với tâm cụm thứ c tại site dữ liệu i thuộc từ 0 đến 1
15: Đảm bảo rằng tổng mức độ thành viên của một điểm dữ liệu vào các cụm là 1
16, 17: Giới hạn mức độ hợp tác giữa các site dữ liệu, đảm bảo rằng không có site nào có ảnh hưởng
quá lớn )