Mi az adatmaszkolási technológia és megoldás a Network Packet Brokerben?

1. Az adatmaszkolás fogalma

Az adatmaszkolást adatmaszkolásnak is nevezik. Ez egy technikai módszer érzékeny adatok, például mobiltelefonszám, bankkártyaszám és egyéb információk konvertálására, módosítására vagy lefedésére, ha maszkolási szabályokat és szabályzatokat adtunk meg. Ezt a technikát elsősorban az érzékeny adatok megbízhatatlan környezetben való közvetlen felhasználásának megakadályozására használják.

Adatmaszkolás elve: Az adatmaszkolásnak meg kell őriznie az eredeti adatjellemzőket, üzleti szabályokat és az adatok relevanciáját, hogy a későbbi fejlesztést, tesztelést és adatelemzést ne befolyásolja a maszkolás. Biztosítsa az adatok konzisztenciáját és érvényességét a maszkolás előtt és után.

2. Data Masking osztályozás

Az adatmaszkolás statikus adatmaszkolásra (SDM) és dinamikus adatmaszkolásra (DDM) osztható.

Statikus adatmaszkolás (SDM): A statikus adatmaszkolás új, nem termelési környezeti adatbázis létrehozását igényli az éles környezettől való elkülönítéshez. Az érzékeny adatokat a rendszer kivonja a termelési adatbázisból, majd a nem termelési adatbázisban tárolja. Ily módon a deszenzitizált adatok el vannak izolálva a termelési környezettől, ami megfelel az üzleti igényeknek és biztosítja a termelési adatok biztonságát.

SDM

Dinamikus adatmaszkolás (DDM): Általában az éles környezetben használják az érzékeny adatok valós idejű érzékenységének csökkentésére. Néha különböző szintű maszkolás szükséges ugyanazon érzékeny adatok különböző helyzetekben történő olvasásához. Például a különböző szerepkörök és engedélyek különböző maszkolási sémákat valósíthatnak meg.

DDM

Adatjelentési és adattermék-maszkoló alkalmazás

Az ilyen forgatókönyvek főként a belső adatfigyelő termékeket vagy óriásplakátokat, a külső szolgáltatási adattermékeket és az adatelemzésen alapuló jelentéseket tartalmazzák, mint például az üzleti jelentések és a projektek áttekintése.

adatjelentés termékmaszkolás

3. Adatmaszkoló megoldás

A gyakori adatmaszkolási sémák a következők: érvénytelenítés, véletlenszerű érték, adatcsere, szimmetrikus titkosítás, átlagérték, eltolás és kerekítés stb.

Érvénytelenítés: Az érvénytelenítés az érzékeny adatok titkosítására, csonkítására vagy elrejtésére utal. Ez a séma általában a valós adatokat speciális szimbólumokkal (például *) helyettesíti. A művelet egyszerű, de a felhasználók nem ismerhetik az eredeti adatok formátumát, ami hatással lehet a későbbi adatalkalmazásokra.

Véletlenszerű érték: A véletlenszerű érték az érzékeny adatok véletlenszerű helyettesítésére utal (a számok a számjegyeket, a betűk a betűket, a karakterek a karaktereket helyettesítik). Ez a maszkolási módszer bizonyos mértékig biztosítja az érzékeny adatok formátumát, és megkönnyíti a későbbi adatfelhasználást. Néhány értelmes szóhoz, például személyek és helyek neveihez szükség lehet maszkszótárra.

Adatcsere: Az adatcsere hasonló a nulla és véletlenszerű értékek maszkolásához, azzal a különbséggel, hogy a speciális karakterek vagy véletlenszerű értékek használata helyett a maszkoló adatok egy adott értékre kerülnek.

Szimmetrikus titkosítás: A szimmetrikus titkosítás egy speciális reverzibilis maszkolási módszer. Az érzékeny adatokat titkosítási kulcsokkal és algoritmusokkal titkosítja. A rejtjelezett szöveg formátuma konzisztens az eredeti adatokkal a logikai szabályokban.

Átlagos: Az átlagos sémát gyakran használják statisztikai forgatókönyvekben. Numerikus adatoknál először az átlagukat számítjuk ki, majd a deszenzitizált értékeket véletlenszerűen elosztjuk az átlag körül, így az adatok összege állandó marad.

Eltolás és kerekítés: Ez a módszer véletlen eltolással változtatja meg a digitális adatokat. Az eltolásos kerekítés biztosítja a tartomány hozzávetőleges hitelességét, miközben megőrzi az adatok biztonságát, ami közelebb áll a valós adatokhoz, mint a korábbi sémák, és nagy jelentősége van a big data elemzés forgatókönyvében.

ML-NPB-5660-数据脱敏

Az ajánlott modell"ML-NPB-5660" az adatmaszkoláshoz

4. Általánosan használt adatmaszkolási technikák

(1). Statisztikai technikák

Adatmintavétel és adatösszesítés

- Adatmintavétel: Az eredeti adatkészlet elemzése és értékelése az adatkészlet egy reprezentatív részhalmazának kiválasztásával fontos módszer az azonosítás megszüntetésére szolgáló technikák hatékonyságának javítására.

- Adatok összesítése: A mikroadatok attribútumaira alkalmazott statisztikai technikák (például összegzés, számlálás, átlagolás, maximum és minimum) gyűjteményeként az eredmény az eredeti adathalmaz összes rekordját reprezentálja.

(2). Kriptográfia

A kriptográfia egy általános módszer az érzékenység csökkentésére vagy a deszenzitizáció hatékonyságának fokozására. A különböző típusú titkosítási algoritmusok különböző deszenzibilizációs hatásokat érhetnek el.

- Determinisztikus titkosítás: Nem véletlenszerű szimmetrikus titkosítás. Általában feldolgozza az azonosító adatokat, és szükség esetén vissza tudja fejteni és visszaállítani a titkosított szöveget az eredeti azonosítóra, de a kulcsot megfelelően védeni kell.

- Visszafordíthatatlan titkosítás: A hash funkciót az adatok feldolgozására használják, amelyet általában az azonosító adatokhoz használnak. Nem lehet közvetlenül visszafejteni, és a leképezési kapcsolatot el kell menteni. Ezenkívül a hash funkció sajátossága miatt adatütközés is előfordulhat.

- Homomorf titkosítás: A titkosított szöveg homomorf algoritmust használjuk. Jellemzője, hogy a titkosított szöveges művelet eredménye ugyanaz, mint a dekódolás utáni egyszerű szöveges műveleté. Ezért általában numerikus mezők feldolgozására használják, de teljesítményi okokból nem széles körben használják.

(3). Rendszer technológia

Az elnyomási technológia törli vagy levédi azokat az adatelemeket, amelyek nem felelnek meg a magánélet védelmének, de nem teszi közzé azokat.

- Maszkolás: az attribútum értékének elfedésének legáltalánosabb deszenzitizációs módszerére utal, mint például az ellenfél száma, a személyi igazolvány csillaggal van jelölve, vagy a cím csonka.

- Helyi elnyomás: meghatározott attribútumértékek (oszlopok) törlésének, a nem lényeges adatmezők eltávolításának folyamatára vonatkozik;

- Rekordlezárás: meghatározott rekordok (sorok) törlésének, a nem alapvető adatrekordok törlésének folyamatára vonatkozik.

(4). Álnév Technológia

A pszeudomanning egy azonosítás megszüntetési technika, amely álnevet használ a közvetlen azonosító (vagy más érzékeny azonosító) helyettesítésére. Az álnév-technikák minden egyes információalany számára egyedi azonosítókat hoznak létre a közvetlen vagy érzékeny azonosítók helyett.

- Önállóan generálhat véletlenszerű értékeket, hogy megfeleljen az eredeti azonosítónak, mentse a leképezési táblát, és szigorúan szabályozza a leképezési táblához való hozzáférést.

- Titkosítást is használhat álnevek előállításához, de a visszafejtő kulcsot megfelelően meg kell őriznie;

Ezt a technológiát széles körben használják nagyszámú független adatfelhasználó esetén, mint például az OpenID a nyílt platform forgatókönyvében, ahol a különböző fejlesztők ugyanazon felhasználó számára különböző OpenID-eket szereznek be.

(5). Általánosítási technikák

Az általánosítási technika olyan azonosítás-eltávolítási technikára utal, amely csökkenti az adathalmaz kiválasztott attribútumainak részletességét, és általánosabb és elvontabb leírást ad az adatokról. Az általánosítási technológia könnyen megvalósítható, és képes megvédeni a rekordszintű adatok hitelességét. Általában adattermékekben vagy adatjelentésekben használják.

- Kerekítés: magában foglalja a kiválasztott attribútum kerekítési alapjának kiválasztását, például a felfelé vagy lefelé irányuló kriminalisztikai eredményeket 100, 500, 1K és 10K

- Felső és alsó kódolási technikák: Cserélje le a küszöbérték feletti (vagy alatti) értékeket a felső (vagy alsó) szintet képviselő küszöbértékkel, ami „X felett” vagy „X alatt” eredményt eredményez.

(6). Randomizációs technikák

Egyfajta de-azonosítási technikaként a randomizációs technológia egy attribútum értékének randomizálással történő módosítását jelenti, így a véletlenszerűsítés utáni érték eltér az eredeti valós értéktől. Ez a folyamat csökkenti a támadók azon képességét, hogy attribútumértéket származtassanak ugyanabban az adatrekordban lévő más attribútumértékekből, de hatással van az eredményül kapott adatok hitelességére, ami általános az éles tesztadatoknál.


Feladás időpontja: 2022.09.27