Home Nieuws Het AI-beveiligingsteam van Microsoft onthult hoe verborgen achterdeurtjes voor trainingen stilletjes overleven...

Het AI-beveiligingsteam van Microsoft onthult hoe verborgen achterdeurtjes voor trainingen stilletjes overleven binnen taalmodellen van ondernemingen

6
0
Het AI-beveiligingsteam van Microsoft onthult hoe verborgen achterdeurtjes voor trainingen stilletjes overleven binnen taalmodellen van ondernemingen


  • Microsoft lanceert een scanner om vergiftigde taalpatronen te detecteren vóór implementatie
  • Backdoor LLM’s kunnen kwaadaardig gedrag verbergen totdat specifieke triggerzinnen verschijnen
  • De scanner identificeert afwijkende aandachtspatronen die verband houden met verborgen achterdeurtriggers

Microsoft heeft de ontwikkeling aangekondigd van een nieuwe scanner die is ontworpen om verborgen achterdeurtjes te detecteren in grote taalmodellen die in bedrijfsomgevingen worden gebruikt.

Het bedrijf zegt dat zijn tool gericht is op het identificeren van gevallen van modelvergiftiging, een vorm van knoeien waarbij kwaadaardig gedrag tijdens de training rechtstreeks in de gewichten van het model wordt verwerkt.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in