Mi az adatmaszkolási technológia és megoldás a hálózati csomag -brókerben?

1. Az adatmaszkolás fogalma

Az adatmaszkolást adatmaszknak is nevezik. Ez egy műszaki módszer az érzékeny adatok, például a mobiltelefonszám, a bankkártya száma és egyéb információk konvertálására, módosítására vagy fedezésére, amikor maszkolási szabályokat és irányelveket adtunk. Ezt a technikát elsősorban az érzékeny adatok közvetlenül a megbízhatatlan környezetben történő felhasználásának megakadályozására használják.

Adatmaszkolási elv: Az adatmaszkolásnak meg kell őriznie az eredeti adatjellemzőket, az üzleti szabályokat és az adatok relevanciáját annak biztosítása érdekében, hogy a későbbi fejlesztés, tesztelés és adatelemzés ne befolyásolja a maszkolás. Gondoskodjon az adatok konzisztenciájának és érvényességének a maszkolás előtt és után.

2. Adatmaszkolás osztályozás

Az adatmaszkolást statikus adatmaszkra (SDM) és dinamikus adatmaszkolásra (DDM) lehet osztani.

Statikus adatmaszkolás (SDM): A statikus adatmaszkoláshoz új, nem termelési környezeti adatbázis létrehozását kell létrehozni a termelési környezettől való elszigeteltséghez. Az érzékeny adatokat kinyerjük a termelési adatbázisból, majd a nem termelési adatbázisban tárolják. Ilyen módon a deszenzibilizált adatok elkülönülnek a termelési környezettől, amely megfelel az üzleti igényeknek és biztosítja a termelési adatok biztonságát.

SDM

Dinamikus adatmaszkolás (DDM): Általában a termelési környezetben használják az érzékeny adatok valós időben történő érzéketlensége. Időnként különböző szintű maszkolási szintre van szükség ahhoz, hogy ugyanazokat az érzékeny adatokat különféle helyzetekben olvassa el. Például a különböző szerepek és engedélyek különböző maszkolási rendszereket hajthatnak végre.

DDM

Adatjelentési és adattermékek maszkoló alkalmazás

Az ilyen forgatókönyvek elsősorban a belső adatfigyelő termékeket vagy a hirdetőtáblákat, a külső szolgáltatási adatokat és az adatok elemzésén alapuló jelentéseket, például az üzleti jelentések és a projekt áttekintését tartalmazzák.

Adatjelentés A termékmaszkolás

3. Adatmaszkolási megoldás

A közös adatmaszkolási rendszerek a következők: érvénytelenítés, véletlenszerű érték, adatcsere, szimmetrikus titkosítás, átlagos érték, eltolás és kerekítés stb.

Érvénytelenítés: Az érvénytelenítés az érzékeny adatok titkosítására, csonkolására vagy elrejtésére utal. Ez a séma általában a valós adatokat speciális szimbólumokkal (például *) helyettesíti. A művelet egyszerű, de a felhasználók nem tudják az eredeti adatok formátumát, amelyek befolyásolhatják a későbbi adat -alkalmazásokat.

Véletlenszerű érték: A véletlenszerű érték az érzékeny adatok véletlenszerű cseréjére vonatkozik (a számok számjegyeket, a betűk helyettesítik a betűket, a karakterek pedig a karaktereket). Ez a maszkolási módszer bizonyos mértékig biztosítja az érzékeny adatok formátumát, és megkönnyíti a későbbi adat -alkalmazást. Szükség lehet a szótárak maszkolására bizonyos értelmes szavakhoz, például az emberek és a helyek nevéhez.

Adatcsere: Az adatok cseréje hasonló a null és a véletlenszerű értékek maszkolásához, azzal a különbséggel, hogy a speciális karakterek vagy véletlenszerű értékek használata helyett a maszkolási adatokat egy adott értékkel helyettesítik.

Szimmetrikus titkosítás: A szimmetrikus titkosítás egy speciális reverzibilis maszkolási módszer. Titkosítja az érzékeny adatokat titkosítási kulcsok és algoritmusok révén. A CipherText formátum megegyezik a logikai szabályok eredeti adatokkal.

Átlagos: Az átlagos sémát gyakran használják a statisztikai forgatókönyvekben. A numerikus adatok esetében először kiszámoljuk azok átlagát, majd véletlenszerűen osztjuk el a deszenzibilizált értékeket az átlag körül, ezáltal az adatok összegét állandóan tartva.

Eltolás és kerekítés: Ez a módszer megváltoztatja a digitális adatokat véletlenszerű eltolással. Az eltolás kerekítése biztosítja a tartomány hozzávetőleges hitelességét, miközben megőrzi az adatok biztonságát, amely közelebb áll a valós adatokhoz, mint az előző rendszerek, és nagy jelentőséggel bír a nagy adatok elemzésének forgatókönyvében.

ML-NPB-5660- 数据脱敏

Az ajánlási modell "ML-NPB-5660"Az adatmaszkoláshoz

4. Általánosan használt adatmaszkolási technikák

(1). Statisztikai technikák

Adatmintavétel és adatgyűjtés

- Adat mintavétel: Az eredeti adatkészlet elemzése és értékelése az adatkészlet reprezentatív részhalmazának kiválasztásával fontos módszer a de-azonosító technikák hatékonyságának javítására.

- Adat -aggregáció: A statisztikai technikák (például összegzés, számlálás, átlagolás, maximális és minimális) gyűjteményeként a mikrodatban szereplő attribútumokra alkalmazva az eredmény az eredeti adatkészlet összes rekordjának reprezentatív.

(2). Rejtjelezés

A kriptográfia egy általános módszer a deszenzibilizáció hatékonyságának deszenzitizálására vagy javítására. Különböző típusú titkosítási algoritmusok érhetik el a deszenzibilizációs hatásokat.

- Determinisztikus titkosítás: nem véletlenszerű szimmetrikus titkosítás. Általában feldolgozza az azonosító adatait, és szükség esetén visszafejti és visszaállíthatja a rejtjelezést az eredeti azonosítóra, de a kulcsot megfelelően kell védeni.

- Visszatéríthetetlen titkosítás: A hash funkciót használják az adatok feldolgozásához, amelyet általában az azonosító adatokhoz használnak. Nem lehet közvetlenül visszafejteni, és a leképezési kapcsolatot meg kell menteni. Ezenkívül a hash -funkció jellemzője miatt az adatok ütközése előfordulhat.

- Homomorf titkosítás: A rejtjelek homomorf algoritmust használják. Jellemzője az, hogy a rejtjelezésű művelet eredménye megegyezik a dekódolás utáni sima műveletével. Ezért általában a numerikus mezők feldolgozására használják, de teljesítmény okokból nem használják széles körben.

(3). Rendszer -technológia

A szuppressziós technológia olyan adatelemeket töröl vagy pajzsol, amelyek nem felelnek meg a magánélet védelmének, de nem teszik közzé azokat.

- Maszkolás: Arra utal, hogy az attribútum értékének leggyakoribb deszenzibilizációs módszerét, például az ellenfél számát, az igazolványt csillaggal jelöli, vagy a cím csonka.

- Helyi elnyomás: A specifikus attribútumértékek (oszlopok) törlésének folyamatára utal, a nem alapvető adatmezők eltávolítására;

- Nyilvántartási elnyomás: A konkrét rekordok (sorok) törlésének folyamatára utal, a nem alapvető adatrekordok törlésére.

(4). Álnév technológia

Az álnév-azonosítási technika, amely álnévvel használja a közvetlen azonosító (vagy más érzékeny azonosító) helyettesítését. Az álnév technikák egyedi azonosítókat hoznak létre az egyes információs alanyok számára, a közvetlen vagy érzékeny azonosítók helyett.

- Véletlenszerű értékeket generálhat önállóan, hogy megfeleljen az eredeti azonosítónak, menti a leképezési táblázatot, és szigorúan vezérelje a térképezési táblázathoz való hozzáférést.

- Használhat titkosítást is álnevek előállításához, de a dekódolási kulcsot megfelelően kell tartani;

Ezt a technológiát széles körben használják nagyszámú független adathasználó esetén, például az OpenID -t a nyílt platform forgatókönyvében, ahol a különböző fejlesztők különböző nyitottAD -eket szereznek ugyanazon felhasználó számára.

(5). Általánosítási technikák

Az általánosítási technika egy olyan azonosítási technikára utal, amely csökkenti a kiválasztott attribútumok granularitását egy adatkészletben, és az adatok általánosabb és absztrakt leírását nyújtja. Az általánosítási technológia könnyen megvalósítható, és megvédi a rekordszintű adatok hitelességét. Általában adattermékekben vagy adatjelentésekben használják.

- Kerekítés: Magában foglalja a kiválasztott attribútum kerekítő alapjának kiválasztását, például felfelé vagy lefelé, a kriminalisztika, a 100, 500, 1K és 10K eredmények eredményeként

- Felső és alsó kódolási technikák: Cserélje ki a küszöb feletti (vagy alatta) értékeket egy küszöbértékkel, amely a felső (vagy alsó) szintet képviseli, és az "x" vagy a "X alatti" eredményt eredményezi.

(6). Randomizációs technikák

Mint egyfajta azonosítási technika, a randomizációs technológia arra utal, hogy egy attribútum értékét a randomizáción keresztül módosítja, így a randomizálás utáni érték különbözik az eredeti valós értéktől. Ez a folyamat csökkenti a támadó azon képességét, hogy az attribútumértéket más attribútum -értékekből származtatja ugyanabban az adatrekordban, de befolyásolja a kapott adatok hitelességét, amely a termelési teszt adatokban jellemző.


A postai idő: szeptember-27-2022