Dil modelleri bazen kontrolden çıkarak tuhaf ve rahatsız edici kişiliklere bürünebilir...
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
12 Likes
Reward
12
3
Share
Comment
0/400
AirdropHunter007
· 15h ago
Yapay zeka da mı parçalanmaya başladı?
View OriginalReply0
BridgeNomad
· 15h ago
smh... başka bir güvenlik risk vektörünü izlememiz gerekiyor. güven varsayımları gerçekten korkutucu olmaya devam ediyor.
View OriginalReply0
RugResistant
· 16h ago
burada bir kırmızı bayrak tespit edildi... bu kişi sapmalarının acilen güvenlik denetimine ihtiyacı var
Yeni Anthropic araştırması: Persona vektörleri.
Dil modelleri bazen kontrolden çıkarak tuhaf ve rahatsız edici kişiliklere bürünebilir...