Mi az adatmaszkolási technológia és megoldás a hálózati csomagközvetítőben?

1. Az adatmaszkolás koncepciója

Az adatmaszkolás adatmaszkolásként is ismert. Ez egy technikai módszer érzékeny adatok, például mobiltelefonszám, bankkártyaszám és egyéb információk konvertálására, módosítására vagy elrejtésére, amennyiben maszkolási szabályokat és irányelveket adtunk meg. Ezt a technikát elsősorban annak megakadályozására használják, hogy az érzékeny adatokat közvetlenül megbízhatatlan környezetekben használják.

Adatmaszkolás elve: Az adatmaszkolásnak meg kell őriznie az eredeti adatjellemzőket, üzleti szabályokat és az adatok relevanciáját annak biztosítása érdekében, hogy a későbbi fejlesztést, tesztelést és adatelemzést ne befolyásolja a maszkolás. Biztosítsa az adatok konzisztenciáját és érvényességét a maszkolás előtt és után.

2. Adatmaszkolás osztályozása

Az adatmaszkolás statikus adatmaszkolásra (SDM) és dinamikus adatmaszkolásra (DDM) osztható.

Statikus adatmaszkolás (SDM)A statikus adatmaszkoláshoz egy új, nem termelési környezeti adatbázis létrehozására van szükség az éles környezettől való elkülönítéshez. Az érzékeny adatokat az éles adatbázisból nyerik ki, majd a nem termelési adatbázisban tárolják. Ily módon az érzéketlenné tett adatokat elkülönítik az éles környezettől, ami megfelel az üzleti igényeknek és biztosítja az éles adatok biztonságát.

SDM

Dinamikus adatmaszkolás (DDM)Általában éles környezetben használják az érzékeny adatok valós idejű érzéketlenítésére. Néha különböző szintű maszkolásra van szükség ugyanazon érzékeny adatok különböző helyzetekben történő olvasásához. Például a különböző szerepkörök és engedélyek eltérő maszkolási sémákat valósíthatnak meg.

DDM

Adatszolgáltatás és adattermékek maszkolására szolgáló alkalmazás

Az ilyen forgatókönyvek főként belső adatmonitorozási termékeket vagy hirdetőtáblákat, külső szolgáltatási adattermékeket, valamint adatelemzésen alapuló jelentéseket, például üzleti jelentéseket és projektáttekintéseket tartalmaznak.

adatszolgáltatási termékmaszkolás

3. Adatmaszkolási megoldás

Az adatmaszkolás gyakori sémái közé tartozik az érvénytelenítés, a véletlenszerű érték, az adatcsere, a szimmetrikus titkosítás, az átlagérték, az eltolás és a kerekítés stb.

ÉrvénytelenítésAz érvénytelenítés az érzékeny adatok titkosítását, csonkolását vagy elrejtését jelenti. Ez a módszer általában a valós adatokat speciális szimbólumokkal (például *) helyettesíti. A művelet egyszerű, de a felhasználók nem ismerhetik az eredeti adatok formátumát, ami befolyásolhatja a későbbi adatalkalmazásokat.

Véletlenszerű értékA véletlenszerű érték az érzékeny adatok véletlenszerű cseréjére utal (számok helyettesítik a számjegyeket, betűk helyettesítik a betűket, karakterek pedig a karaktereket). Ez a maszkolási módszer bizonyos mértékig biztosítja az érzékeny adatok formátumát, és megkönnyíti a későbbi adatfelhasználást. Egyes jelentőségteljes szavakhoz, például személyek és helyek nevéhez maszkoló szótárak szükségesek lehetnek.

AdatcsereAz adatcsere hasonló a null és véletlenszerű értékek maszkolásához, azzal a különbséggel, hogy speciális karakterek vagy véletlenszerű értékek helyett a maszkoló adatokat egy adott értékkel helyettesíti.

Szimmetrikus titkosításA szimmetrikus titkosítás egy speciális, visszafordítható maszkolási módszer. Titkosítókulcsok és algoritmusok segítségével titkosítja az érzékeny adatokat. A titkosított szöveg formátuma logikai szabályokban megegyezik az eredeti adatokkal.

ÁtlagosAz átlagolási sémát gyakran használják statisztikai forgatókönyvekben. Numerikus adatok esetén először kiszámítjuk az átlagukat, majd véletlenszerűen elosztjuk a deszenzibilizált értékeket az átlag körül, így az adatok összege állandó marad.

Eltolás és kerekítésEz a módszer véletlenszerű eltolással módosítja a digitális adatokat. Az eltolásos kerekítés biztosítja a tartomány hozzávetőleges hitelességét, miközben megőrzi az adatok biztonságát, amelyek közelebb állnak a valós adatokhoz, mint a korábbi sémák, és nagy jelentőséggel bír a big data elemzés során.

ML-NPB-5660-数据脱敏

Az ajánlott modell "ML-NPB-5660"az adatmaszkoláshoz"

4. Gyakran használt adatmaszkolási technikák

(1). Statisztikai technikák

Adatmintavételezés és adataggregáció

- Adatmintavétel: Az eredeti adathalmaz reprezentatív részhalmazának kiválasztásával végzett elemzése és értékelése fontos módszer az azonosíthatatlanná tévő technikák hatékonyságának javítására.

- Adataggregáció: A mikroadatok attribútumaira alkalmazott statisztikai technikák (például összegzés, számlálás, átlagolás, maximum és minimum) összességeként az eredmény az eredeti adathalmaz összes rekordjára reprezentatív.

(2). Kriptográfia

A kriptográfia egy gyakori módszer az érzéketlenség csökkentésére vagy a deszenzitizáció hatékonyságának növelésére. A különböző típusú titkosító algoritmusok eltérő deszenzitizációs hatásokat érhetnek el.

- Determinisztikus titkosítás: Nem véletlenszerű szimmetrikus titkosítás. Általában azonosító adatokat dolgoz fel, és szükség esetén vissza tudja fejteni és vissza tudja állítani a titkosított szöveget az eredeti azonosítóra, de a kulcsot megfelelően védeni kell.

- Visszafordíthatatlan titkosítás: A hash függvényt adatfeldolgozásra használják, amelyet általában azonosító adatokhoz használnak. Nem lehet közvetlenül visszafejteni, és a megfeleltetési kapcsolatot menteni kell. Ezenkívül a hash függvény tulajdonsága miatt adatütközés is előfordulhat.

- Homomorf titkosítás: A rejtjelezett szöveg homomorf algoritmusát használják. Jellemzője, hogy a rejtjelezett szöveges művelet eredménye megegyezik a sima szöveges művelet eredményével a visszafejtés után. Ezért általában numerikus mezők feldolgozására használják, de teljesítménybeli okokból nem széles körben elterjedt.

(3). Rendszertechnológia

Az elnyomási technológia törli vagy elrejti azokat az adatelemeket, amelyek nem felelnek meg az adatvédelmi előírásoknak, de nem teszi közzé azokat.

- Maszkolás: a leggyakoribb érzéketlenné tételi módszerre utal, amely az attribútum értékét maszkolja, például az ellenfél számát, azonosító kártyáját csillaggal jelöli, vagy a címet csonkolja.

- Lokális elnyomás: adott attribútumértékek (oszlopok) törlésének folyamatára utal, a nem létfontosságú adatmezők eltávolításával;

- Rekordok letiltása: meghatározott rekordok (sorok) törlésének folyamatára utal, a nem létfontosságú adatrekordok törlésére.

(4). Álnévtechnológia

Az álnévhasználat egy olyan anonimizálási technika, amely álnevet használ egy közvetlen azonosító (vagy más érzékeny azonosító) helyett. Az álnévtechnikák minden egyes adatalanyhoz egyedi azonosítókat hoznak létre közvetlen vagy érzékeny azonosítók helyett.

- Véletlenszerű értékeket képes generálni függetlenül az eredeti azonosítónak megfelelően, menteni a leképezési táblázatot, és szigorúan szabályozni a leképezési táblázathoz való hozzáférést.

- Titkosítást is használhatsz álnevek létrehozására, de a visszafejtési kulcsot megfelelően kell őrizned;

Ezt a technológiát széles körben használják nagyszámú független adatfelhasználó esetén, például az OpenID esetében a nyílt platformú forgatókönyvben, ahol a különböző fejlesztők különböző OpenID-ket kapnak ugyanahhoz a felhasználóhoz.

(5). Általánosítási technikák

Az általánosítási technika egy olyan azonosíthatatlanná tévő technikára utal, amely csökkenti a kiválasztott attribútumok részletességét egy adathalmazban, és általánosabb, absztraktabb leírást ad az adatokról. Az általánosítási technológia könnyen megvalósítható, és képes megvédeni a rekordszintű adatok hitelességét. Gyakran használják adattermékekben vagy adatjelentésekben.

- Kerekítés: a kiválasztott attribútum kerekítési alapjának kiválasztását jelenti, például felfelé vagy lefelé történő becslést, amely 100, 500, 1000 és 10000 eredményt eredményez.

- Felső és alsó kódolási technikák: A küszöbérték feletti (vagy alatti) értékeket a felső (vagy alsó) szintet képviselő küszöbértékkel cseréljük le, így „X felett” vagy „X alatt” eredményt kapunk.

(6). Véletlenszerűsítési technikák

Az azonosíthatatlanná tétel egyfajta technikájaként a randomizálási technológia egy attribútum értékének véletlenszerűsítéssel történő módosítására utal, így a véletlenszerűsítés utáni érték eltér az eredeti valós értéktől. Ez a folyamat csökkenti a támadó azon képességét, hogy egy attribútumértéket ugyanabban az adatrekordban lévő más attribútumértékekből származtasson, de befolyásolja a kapott adatok hitelességét, ami gyakori az éles tesztadatoknál.


Közzététel ideje: 2022. szeptember 27.