Simbolu maskarāde: uz unikodu orientēti drošības aspekti. Failu vietā Windows zibatmiņas diskā dažādās Windows lietojumprogrammās ir “hieroglifi” (nesaprotami simboli).

Krakozyabry - kas ir tik interesants vārds? Šo vārdu krievu lietotāji parasti izmanto, lai aprakstītu nepareizu/nepareizu rakstzīmju rādīšanu (kodējumu) programmās vai pašu Operētājsistēmu.
Kāpēc tas notiek? Jūs neatradīsit noteiktu atbildi. Tas var būt saistīts ar mūsu "iemīļoto" vīrusu viltībām, iespējams, Windows OS darbības traucējumu dēļ (piemēram, pazuda elektrība un izslēdzās dators), iespējams, programma radīja konfliktu ar citu OS un viss aizgāja. siena stieple. Kopumā var būt daudz iemeslu, bet visinteresantākais ir "Tas vienkārši sabojājās."
Izlasiet rakstu un uzziniet, kā novērst kodēšanas problēmu programmās un operētājsistēmā Windows OS, kad tā ir notikusi.

Tiem, kas joprojām nesaprot, ko es domāju, šeit ir daži:


Starp citu, arī es reiz nokļuvu šādā situācijā, un manā darbvirsmā joprojām ir fails, kas man palīdzēja ar to tikt galā. Tāpēc es nolēmu uzrakstīt šo rakstu.

Par kodējuma (fonta) parādīšanu sistēmā Windows ir atbildīgas vairākas “lietas” - valoda, reģistrs un pašas OS faili. Tagad mēs tos pārbaudīsim atsevišķi un pa punktam.

Kā noņemt un labot krakozyabry, nevis krievu (krievu burtus) programmā vai Windows.

1. Pārbaudiet instalētā valoda programmām, kas neatbalsta Unicode. Varbūt tas tev ir pazudis.

Tātad, sekosim ceļam: Vadības panelis - Reģionālās un valodas opcijas - cilne Papildu
Tur pārliecināmies, ka valoda ir krievu.


Operētājsistēmā Windows XP papildus tam apakšā ir saraksts ar “Reklāmguvumu tabulas kodu lapām”, un tajā ir rinda ar numuru 20880. Tur ir jābūt arī krievam

6. Pēdējais punkts, kurā es jums iedodu failu, kas man vienreiz palīdzēja visu salabot, un tāpēc es to atstāju kā piemiņu. Šeit ir arhīvs:

Iekšpusē ir divi faili: krakozbroff.cmd un krakozbroff.reg

Viņiem ir viens un tas pats princips - pareizi hieroglifus, kvadrātus, jautājumus vai izsaukuma zīmes programmās un Windows OS (parastajā valodā, krakozyabry). Es izmantoju pirmo, un tas man palīdzēja.

Un visbeidzot, pāris padomi:
1) Ja strādājat ar reģistru, neaizmirstiet izveidot dublējumu ( rezerves kopija), ja kaut kas noiet greizi.
2) Pēc katra punkta vēlams pārbaudīt 1. punktu.

Tas ir viss. Tagad jūs zināt, kā programmā vai sistēmā Windows labot/noņemt krekerus (kvadrātus, hieroglifus, izsaukuma un jautājuma zīmes).

Uzmanību!!! Gatavojieties, šis raksts būs garš. Jūs varat nogurt un aizmigt, tāpēc apsēdieties, paņemiet tasi kafijas un sākam.


Ķīniešu rakstzīmju apguve ir svarīga pašas valodas apguves sastāvdaļa. Ir daudz veidu, līdzekļu un ideju, kā tos izpētīt. Šajā rakstā tiks runāts par dažiem no tiem. Dažādi cilvēki, atkarībā no saviem mērķiem, māca tos atšķirīgi.
Piemēram, kāds vienkārši vēlas uzzināt noteiktu rakstzīmju skaitu. Citi vēlas lasīt tekstu ar hieroglifiem. Citi vēlas ne tikai lasīt, bet arī prast rakstīt hieroglifus. Un tad ir tie, kas gatavojas taisīt piezīmes ķīniešu valodā vai rakstīt tekstus. Atkal rakstiet ar roku, jo datora rakstīšana ir daudz vienkāršāka.
Ir vērts atzīmēt, ka mūsdienu aizņemtība neļauj cilvēkam pilnībā iegremdēties mācību procesā bez traucēkļiem. Īpaši grūti ir tiem, kuri valodu apgūst paši un “kad vien var”. Ir vērts izvēlēties veidu, kā individuāli pētīt hieroglifus. Tie, kuriem ir ierobežots laiks, iespējams, vēlas atrast savai ierīcei ērtu aplikāciju, lai brīvajā minūtē varētu “grauzt zinātnes granītu”. Labi, tiem, kas mācās valodu kā specialitāti, visam vajadzētu būt piemērotam, bet kurš gan nevēlas samazināt laiku, kas nepieciešams prasmju apguvei?
Piebildīšu, ka hieroglifa apguve dažādiem cilvēkiem var nozīmēt dažādas lietas. Pilnā nozīmē apgūt hieroglifu nozīmē zināt tā izrunu, pareizrakstību un nozīmi. Tātad, kādi ir veidi, kā attīstīt visas šīs prasmes un apgūt ķīniešu rakstzīmes? Sāksim ar papīra, tad elektroniskiem.

1. Hieroglifu izrakstīšana. Tradicionālais rakstzīmju apguves veids, ko pārbaudījuši miljoniem ķīniešu. Jāatceras, ka viņi izraksta hieroglifus visā skolas kursā. Šie nav pāris gadi. Tātad metodes priekšrocības:
- ir iesaistīta vizuālā un muskuļu atmiņa;
- tiek attīstītas rakstīšanas prasmes un rokraksts;
- hieroglifu izpēte nejaušā secībā;
- spēja nekavējoties atgriezties pie rakstītā;
- cits.

Trūkumi ietver:
- nepieciešams papīrs un rakstāmrīki;
- viena hieroglifa uzrakstīšana aizņem daudz laika;
- jāuzglabā daudz papīra;
- jums ir nepieciešama telpa un laiks kvalitatīvai pieejai vingrinājumiem.
- cits.

Jūs varat rakstīt hieroglifus parastā piezīmju grāmatiņā ar parastu pildspalvu. Tie, kas tam pieiet pamatīgāk, pieraksta īpašās receptēs. Tur bija par hieroglifu rakstīšanu, kā arī elementāru kopiju grāmatu piemēri. Uzlabota zāļu izrakstīšanas metode ir recepšu izrakstīšana, izmantojot veidnes. Tās arī ir dažādas.

1. Veidne. Tas var izskatīties savādāk, bet būtība ir tāda pati. Virs teksta uzliek pauspapīru, uz kura uzraksta hieroglifus. Problēma ir tāda, ka šādā veidnē nav hieroglifu izrunas, tas ir, tiek apmācīta tikai pazīstama atpazīšana un kaligrāfija.


2. Veidne. Ierakstīšana notiek saskaņā ar norādīto pazīmju secību. Ir dota arī hieroglifu nozīme. Izruna paliek aizkulisēs.

3. Ir arī citas receptes, kuru aprakstīšanai būtu vajadzīgs ilgs laiks. Šeit ir saites, kuras varat lejupielādēt un izdrukāt.

2. Asociatīvā metode.

Metodes būtība ir vienkārša. Izdomājiet, kā izskatās hieroglifs, un kaut kā savienojiet šo attēlu ar hieroglifa nozīmi un izrunu. Bija . Visas asociācijas var pierakstīt piezīmju grāmatiņā un atgriezties pie tām, lai atkārtotu.
Tas var ietvert arī hieroglifu apgūšanu, izmantojot taustiņus. Atšķirība ir tāda, ka asociācijas kļūs konkrētas, nevis abstraktas. Bet vispirms jums ir jāapgūst atslēgas. Es par to rakstīju šajā rakstā, un tas bija arī šajā rakstā. Jūs varat apvienot asociācijas un rakstot hieroglifus. Bet tas arī aizņem daudz laika. Bet to atceras ilgu laiku.
No otras puses, vairāk par to bija šajā rakstā.

3. Kartes.

Tās ir zibatmiņas kartes. Lieta tāda, ka uz kartītēm ir uzrakstīti vai vienkārši uzdrukāti hieroglifi. Ieslēgts aizmugurējā puse to nozīmi, izrunu vai abus. Tas nepalīdz visiem, tas aizņem vietu, prasa daudz laika klasifikācijai un, vēlams, labu vizuālo atmiņu. Šeit ir dažas no manām vecajām kolekcijām:


Starp citu, tas palīdz dažiem cilvēkiem, kad viņi apgūst programmu no mācību grāmatām, kas nodrošina hieroglifu rakstīšanas secības. Tās varētu būt Zadoenko, Kondraševska u.c. mācību grāmatas.


Var būt. Pieredzējis ķīniešu valodas students varēs sniegt citus “papīra” veidus, kā apgūt un iegaumēt hieroglifus. Bet es nolēmu pagaidām pakavēties pie iepriekš teiktā. Pāriesim pie elektroniskajiem.

1. Flash kartes.

Cilvēki saprata, ka vairāki tūkstoši hieroglifu ir liels karšu apjoms. Vesela kaste! Tas ir iespējams iekšā elektroniskā formātā dari tos. Mēs izveidojām visa veida programmas, kas dažādas platformas ah, atveidojiet šīs kartes.

Ikvienam, kam interesē šī metode, vajadzētu iepazīties ar programmu. Arī ne visiem. Ar vizuālo atmiņu saistās arī bilžu atkārtošanās. Ne visi tajā padodas vienlīdz labi. Bet ne tikai japāņu un ķīniešu var iemācīties. Turklāt aplikācija ir pieejama dažādām platformām.

Ir arī citi tāda paša rakstura lietojumi. Piemēram, Magazeta vietnē bija viena šāda lietojumprogramma: saite uz rakstu.

2. Hieroglifu procesori.

Reiz mēģināju iepazīties ar hieroglifiem, izmantojot programmu NJStar. Īsti nepalīdzēja, bet kāds viņai to varētu atrast noderīga lietojumprogramma savā datorā. Šeit . Šajā programmā jūs varat ievadīt hieroglifus ar peli.

3. Tiešsaistes tulkotāji.

Google tulkotājam ir skārienekrāna ievades funkcija. Tur jūs varat rakstīt hieroglifus ar pirkstu tieši savā mobilajā ierīcē. Nepieciešams internets. Nav skaidras iegaumēšanas programmas, ir tikai iespēja rakstīt nevis uz papīra. Tas pats attiecas uz hieroglifu ievadīšanu ar peli tiešsaistes vārdnīcās, piemēram, www.bkrs.info. Blakus meklēšanas joslai ir manuālas ievades poga, dažreiz tā nav redzama līnijas tēmas dēļ, taču tā noteikti atrodas labajā pusē. Jūs varat ievadīt hieroglifu ar peli un redzēt tā nozīmi, dažreiz klausīties izrunu. Novērš nepieciešamību rakstīt uz papīra.

4. Citas programmas.

Citu programmatūru var atrast internetā. Neesmu visu pārbaudījis, tāpēc neko daudz nevaru aprakstīt. Bet es gribu teikt dažus vārdus par MAO sistēmu. Man nepatika pieeja hieroglifu iegaumēšanai, taču es tomēr nolēmu to prezentēt šajā rakstā, jo ir lietojumprogramma “MAOcard”. Un kāds var novērtēt šo sistēmu augstāk par mani. Saite...

Turpināsim...

Par šo varat rakstīt jebko citu, bet, lai ietaupītu vismaz jūsu laiku, iedošu saiti uz lapu no Žurnāla, kur autors nodrošina veselu kaudzi noderīgas programmatūras dažādām platformām. Cita starpā ir pieteikumi hieroglifu izpētei un atkārtošanai. Bet es tomēr gribētu uzsvērt, ka viena lieta ir atkārtot vai atcerēties hieroglifus, un pavisam cita lieta ir tos iegaumēt. Šķiet, ka tam ir jēga, ja jūs vai nu zināt vārdus, bet neprotat lasīt, vai arī iemācāties gan vārdus, gan rakstzīmes vienlaikus. Šiem nolūkiem ir piemēroti īpaši pielietojumi.

Īpaši vēlos pieminēt aplikāciju Android platformai "Chineseskill". Tas attīstās un, manuprāt, apvieno daudzas priekšrocības. Hieroglifu izpēte notiek paralēli vārdu krājuma un gramatikas izpētei. Jums būs jāraksta un jāizrunā vārdi. Dažreiz manuāli, ar pirkstu. Varbūt tas ir tas, kas tev vajadzīgs?...

Vēl viena programma, ko iesaku studentiem Ķīniešu un iekš Konkrēti, hieroglifi ir lietojumprogramma "ķīniešu rakstnieks". Es jau izdarīju Īss aprakstsšo pieteikumu. Bet es teikšu, ka pat ar dažām neērtībām, piemēram, ložņu līniju ekrāna apakšā ar informāciju par hieroglifu, lietojumprogramma ir lieliska. Varat apskatīt hieroglifus, iemācīties tos rakstīt, pārbaudīt sevi spēlē un daudz ko citu. Manuprāt, šim tev vajadzētu būt tavā ierīcē... Ir maksas un bezmaksas versijas.

Secinājums.

Nobeigumā teikšu, ka nevarēju uzskaitīt visu, kas bija manā viedtālrunī un planšetdatorā. ES mēģināju dažādas programmas, bet diemžēl tas nav ideāli. Vai varbūt es to vēl neesmu atradis. Bet tas, ko es uzskaitīju iepriekš, ir vērts izmēģināt. Vienā vai otrā veidā tie visi ir tikai līdzekļi hieroglifu ievadīšanai jūsu atmiņā. Bet kā viņa tos uztvers, vai vēlāk gribēs atdot, tas ir cits jautājums. Tāpēc papildus pašu hieroglifu izpētei iesaku labi izgulēties un trenēt atmiņu. Paldies, ka izlasījāt līdz galam, tagad jūsu izpratne par problēmu, iespējams, ir plašāka.

Es domāju, ka esat vairāk nekā vienu reizi saskāries ar ļaunprātīgām darbībām, kas ir klasificētas kā Unicode, meklējāt pareizo kodējumu, lai parādītu lapu, un esat apmierināts ar nākamajiem trikiem šeit un tur. Jūs nekad nezināt, kas vēl! Ja vēlies noskaidrot, kurš visu šo nekārtību aizsāka un tīra līdz šai dienai, piesprādzējas un lasi tālāk.

Kā saka, “iniciatīva ir sodāma”, un, kā vienmēr, pie visa vainīgi amerikāņi.

Un tas bija šādi. Datorindustrijas uzplaukuma un interneta izplatības rītausmā radās nepieciešamība pēc universālas simbolu attēlošanas sistēmas. Un pagājušā gadsimta 60. gados parādījās ASCII - “Amerikas standarta informācijas apmaiņas kods” (amerikāņu valodā Standarta kods informācijas apmaiņai), pazīstams 7 bitu rakstzīmju kodējums. Pēdējais astotais neizmantotais bits tika atstāts kā kontroles bits, lai pielāgotu ASCII tabulu, lai tā atbilstu katra datora klienta vajadzībām noteiktā reģionā. Šis bits ļāva paplašināt ASCII tabulu, lai katrai valodai izmantotu savas rakstzīmes. Datori tika piegādāti daudzām valstīm, kur viņi jau izmantoja savu pārveidoto tabulu. Taču vēlāk šī funkcija kļuva par galvassāpēm, jo ​​datu apmaiņa starp datoriem kļuva diezgan problemātiska. Jauns 8 bitu kodu lapas bija nesavietojami viens ar otru - viens un tas pats kods var nozīmēt vairākas dažādas rakstzīmes. Lai atrisinātu šo problēmu, ierosināja ISO (“Starptautiskā standartizācijas organizācija”, Starptautiskā standartizācijas organizācija). jauns galds, proti, “ISO 8859”.

Šis standarts vēlāk tika pārdēvēts par UCS (“Universal Character Set”). Tomēr līdz brīdim, kad UCS pirmo reizi tika izlaists, bija parādījies Unicode. Bet, tā kā abu standartu mērķi un uzdevumi sakrita, tika nolemts apvienot spēkus. Unicode ir uzņēmies sarežģīto uzdevumu piešķirt katrai rakstzīmei unikālu apzīmējumu. Pašlaik jaunākā Unicode versija ir 5.2.

Gribu brīdināt – patiesībā stāsts ar kodējumiem ir ļoti miglains. Dažādi avoti sniedz dažādus faktus, tāpēc jums nevajadzētu koncentrēties uz vienu lietu, vienkārši apzināties, kā viss veidojies, un ievērot mūsdienu standartus. Mēs, es ceru, neesam vēsturnieki.

Unikoda avārijas kurss

Pirms iedziļināties tēmā, es vēlētos paskaidrot, kas ir Unicode tehniskā izteiksmē. Mērķi šis standarts Mēs jau zinām, atliek tikai salabot aparatūru.

Tātad, kas ir Unicode? Vienkārši sakot, tas ir veids, kā attēlot jebkuru rakstzīmi kā īpašu kodu visām pasaules valodām. Jaunākā versija Standarts satur aptuveni 1 100 000 kodu, kas aizņem vietu no U+0000 līdz U+10FFFF. Bet esiet uzmanīgi šeit! Unicode stingri nosaka, kas ir rakstzīmes kods un kā šis kods tiks attēlots atmiņā. Rakstzīmju kodiem (piemēram, 0041 rakstzīmei “A”) nav nekādas nozīmes, taču ir loģika šo kodu attēlošanai baitos; tas tiek darīts ar kodējumu palīdzību. Unikoda konsorcijs piedāvā šādus kodējumu veidus, ko sauc par UTF (Unicode Transformation Formats). Un šeit viņi ir:

  • UTF-7: šis kodējums nav ieteicams drošības un saderības apsvērumu dēļ. Aprakstīts RFC 2152. Nav daļa no Unicode, bet to ieviesa šis konsorcijs.
  • UTF-8: visizplatītākais kodējums tīmekļa telpā. Ir mainīgs, 1 līdz 4 baiti plats. Atpakaļ saderīgs ar protokoliem un programmām, kas izmanto ASCII. Tas aizņem diapazonu no U+0000 līdz U+007F.
  • UTF-16: izmanto mainīgu platumu no 2 līdz 4 baitiem. Visbiežāk tiek izmantoti 2 baiti. UCS-2 ir tas pats kodējums, tikai ar fiksētu 2 baitu platumu un ierobežotu līdz BMP ierobežojumiem.
  • UTF-32: izmanto fiksētu 4 baitu platumu, t.i., 32 bitus. Tomēr tiek izmantots tikai 21 bits, atlikušie 11 ir aizpildīti ar nullēm. Lai gan šis kodējums ir apgrūtinošs vietas ziņā, tas tiek uzskatīts par visefektīvāko veiktspējas ziņā, pateicoties 32 bitu adresēšanai mūsdienu datoros.

Tuvākais UTF-32 analogs ir UCS-4 kodējums, taču šodien tas tiek izmantots retāk.

Neskatoties uz to, ka UTF-8 un UTF-32 var attēlot nedaudz vairāk par diviem miljardiem rakstzīmju, tika nolemts aprobežoties ar nedaudz vairāk par miljonu, lai nodrošinātu saderību ar UTF-16. Visa koda telpa ir sagrupēta 17 plaknēs, katrā no tām ir 65 536 simboli. Biežāk izmantotie simboli atrodas nulles, bāzes plaknē. Apzīmēts kā BMP — Basic MultiPlane.
Datu straumi UTF-16 un UTF-32 kodējumos var attēlot divos veidos - mazajā un lielajā, ko attiecīgi sauc par UTF-16LE/UTF-32LE, UTF16BE/UTF-32BE. Kā jūs jau nojaušat, LE ir mazs, bet BE ir liels. Bet mums kaut kā jāspēj atšķirt šīs kārtas. Lai to izdarītu, izmantojiet baitu secības atzīmi U+FEFF, angļu valodā - BOM, “Byte Order Mask”. Šī BOM var parādīties arī UTF-8, taču tas tur neko nenozīmē.

Lai nodrošinātu atpakaļsaderību, Unicode bija jāiekļauj rakstzīmes no esošajiem kodējumiem. Bet te rodas cita problēma - ir daudz identisku rakstzīmju variantu, kas kaut kā jāapstrādā. Tāpēc ir nepieciešama tā sauktā “normalizācija”, pēc kuras jau ir iespējams salīdzināt divas virknes. Ir 4 normalizācijas veidi:

  • Normalizācijas forma D (NFD): kanoniskā sadalīšanās.
  • Normalizācijas forma C (NFC): kanoniskā sadalīšanās + kanoniskais sastāvs.
  • Normalizācijas forma KD (NFKD): saderīga sadalīšanās.
  • Normalizācijas forma KC (NFKC): saderīga sadalīšanās + kanoniskais sastāvs.

Tagad parunāsim vairāk par šiem dīvainajiem vārdiem.

Unicode definē divus virkņu vienlīdzības veidus - kanonisko un saderību.

Pirmais ietver sarežģīta simbola sadalīšanu vairākās atsevišķās figūrās, kas kopumā veido sākotnējo simbolu. Otrais vienādojums atrod tuvāko atbilstošo simbolu. Un kompozīcija ir dažādu daļu simbolu kombinācija, sadalīšanās ir pretēja darbība. Kopumā paskatieties uz zīmējumu, viss nostāsies savās vietās.

Drošības apsvērumu dēļ ir jāveic normalizācija, pirms virkne tiek iesniegta pārbaudei jebkuriem filtriem. Pēc šīs darbības teksta lielums var mainīties, kas var radīt negatīvas sekas, bet par to vēlāk.

Teorijas ziņā tas arī viss, vēl neko daudz neesmu teicis, bet ceru, ka neko svarīgu neesmu palaidis garām. Unicode ir neticami plašs, par to tiek izdotas sarežģītas, biezas grāmatas, un ir ļoti grūti īsi, saprotami un pilnībā izskaidrot tik apgrūtinoša standarta pamatus. Jebkurā gadījumā, lai iegūtu dziļāku izpratni, jums vajadzētu pārbaudīt sānu saites. Tātad, kad attēls ar Unicode ir kļuvis vairāk vai mazāk skaidrs, mēs varam doties tālāk.

Vizuāla ilūzija

Jūs, iespējams, esat dzirdējuši par IP/ARP/DNS viltošanu, un jums ir labs priekšstats par to, kas tas ir. Bet ir arī tā sauktā “vizuālā viltošana” - tā ir tā pati vecā metode, ko pikšķerētāji aktīvi izmanto upuru maldināšanai. Šādos gadījumos tiek izmantoti līdzīgi burti, piemēram, “o” un “0”, “5” un “s”. Šī ir visizplatītākā un vienkāršākā iespēja, un to ir vieglāk pamanīt. Piemērs ir 2000. gada pikšķerēšanas uzbrukums PayPal, kas pat tika minēts www.unicode.org lapās. Tomēr tam ir maza nozīme mūsu Unikoda tēmai.

Pieredzējušiem puišiem pie apvāršņa ir parādījies Unicode jeb precīzāk IDN, kas ir saīsinājums no “Internationalized Domain Names”. IDN ļauj domēna nosaukumos izmantot nacionālās alfabēta rakstzīmes. Domēna vārdu reģistratori to pozicionē kā ērtu lietu, viņi saka, zvaniet Domēna vārds savā dzimtajā valodā! Tomēr šī ērtība ir ļoti apšaubāma. Labi, mārketings nav mūsu tēma. Bet iedomājieties, kāds patvērums šeit ir pikšķerētājiem, SEO speciālistiem, kiberskvoteriem un citiem ļaunajiem gariem. Es runāju par efektu, ko sauc par IDN viltošanu. Šis uzbrukums pieder pie vizuālās viltošanas kategorijas; angļu literatūrā to sauc arī par “homograph attack”, tas ir, uzbrukumiem, izmantojot homogrāfus (vārdus, kas ir identiski pareizrakstībā).

Jā, rakstot burtus, neviens nekļūdīsies un neierakstīs apzināti viltus domēnu. Bet visbiežāk lietotāji noklikšķina uz saitēm. Ja vēlies pārliecināties par uzbrukuma efektivitāti un vienkāršību, tad paskaties uz attēlu.

IDNA2003 tika izgudrots kā sava veida panaceja, bet jau šogad, 2010. gadā, stājās spēkā IDNA2008. Jaunajam protokolam bija jāatrisina daudzas jaunā IDNA2003 problēmas, taču tas ieviesa jaunas iespējas viltotiem uzbrukumiem. Atkal rodas saderības problēmas – dažos gadījumos viena un tā pati adrese dažādās pārlūkprogrammās var novest pie dažādiem serveriem. Lieta ir tāda, ka Punycode var pārveidot dažādos veidos dažādas pārlūkprogrammas- viss būs atkarīgs no tā, kuras standarta specifikācijas tiek atbalstītas.
Vizuālās maldināšanas problēma ar to nebeidzas. Unicode tiek izmantots arī surogātpasta izplatītājiem. Mēs runājam par surogātpasta filtriem - oriģinālos burtus surogātpasta sūtītāji nosūta caur Unicode obfuscator, kas meklē līdzīgas rakstzīmes no dažādiem nacionālajiem alfabētiem, izmantojot tā saukto UC-Simlist (“Unikoda līdzību saraksts”, līdzīgu Unikoda rakstzīmju saraksts) . Tas ir viss! Antispama filtrs padodas un vairs nevar atpazīt kaut ko jēgpilnu šādā rakstzīmju jūklī, bet lietotājs ir diezgan spējīgs lasīt tekstu. Es nenoliedzu, ka risinājums šai problēmai ir atrasts, taču surogātpasta izplatītājiem ir pārsvars. Nu un vēl viena lieta no tās pašas uzbrukumu sērijas. Vai esat pārliecināts, ka kaut ko atverat? teksta fails, un netiek galā ar bināro?

Attēlā, kā redzat, mums ir fails ar nosaukumu evilexe. txt. Bet tas ir nepatiess! Failu faktiski sauc par eviltxt.exe. Kas tas par muļķībām iekavās, jūs jautājat? Un tas ir U+202E jeb NO labās uz kreiso OVERRIDE, tā sauktais Bidi (no vārda divvirzienu) — unikoda algoritms, kas atbalsta tādas valodas kā arābu, ebreju un citas. Pēdējiem ir rakstīšana no labās uz kreiso pusi. Pēc unikoda rakstzīmes RLO ievietošanas mēs redzēsim visu, kas nāk pēc RLO apgrieztā secībā. Kā piemērs šī metode no reālās dzīves es varu minēt mānīšanās uzbrukumu programmā Mozilla Firfox — cve.mitre.org/cgi-bin/cvename.cgi?name=CVE-2009-3376.

Filtru apiešana - posms Nr.1

Šodien jau ir zināms, ka UTF-8 garās formas (nevisīsākās formas) nevar apstrādāt, jo tā ir potenciāla ievainojamība. Tomēr PHP izstrādātājus tas nevar pārliecināt. Noskaidrosim, kas ir šī kļūda. Varbūt jūs atceraties par nepareizu filtrēšanu un utf8_decode(). Šo gadījumu mēs apsvērsim sīkāk. Tātad mums ir šāds PHP kods: