Designteman och russifiering av SMF-forumet, samt installation av JFusion-komponenten i Joomla. Lektion tre. Vi samlar de bästa databaserna själva. Detta index php-ämne drivs av smf
Låt oss börja direkt med huvudskriptkoden:
#!/usr/bin/perl
# vilket-forum.pl-skript
# (c) 2010 Alexandr A Alexeev, http://site/
använd strikt;
# kommenterade rader - för stränghet
# om uppgiften är att samla in motorstatistik, lämna den som den är
# om du gör en lista över forum - avkommentera
min $data ;
$data .= $_while (<>
)
;
# kontrollera hur mycket som drivs av phpBB utan en länk i sidfoten Du hittar detta och andra skript som nämns i inlägget i detta arkiv. Manus vilket-forum.pl undersöker HTML-sidans kod för att se om den innehåller signaturer från forummotorn. Vi använde en liknande teknik när vi definierade WordPress och Joomla, men det finns ett par skillnader. För det första laddar inte själva skriptet sidkoden, utan läser den från stdin eller en fil som skickas som ett argument. Detta gör att du kan ladda ner sidan en gång, till exempel med hjälp av wget, och sedan köra den genom flera analysatorer, om vi har fler än en. För det andra, i detta skript är närvaron av en signatur till 100 % ett tecken på motorn. Förra gången gav närvaron av en signatur bara vikt till motsvarande motor och motorn med den största vikten "vann". Jag bestämde mig för att i det här fallet skulle ett sådant tillvägagångssätt bara komplicera koden i onödan. För att testa manuset gjorde jag lite research. Jag sammanställde en lista med flera tusen forum och körde vart och ett av dem genom mitt manus, och bestämde därigenom andelen programsvar och populariteten för olika motorer. För att få listan över forum använde jag min Google-parser. Sådana frågor skickades till sökmotorn site:forum.*.ru och så vidare. Du hittar hela frågegeneratorkoden i filen gen-forumsearch-urls.pl. Förutom zone.ru användes även .su .ua .kz och .by. Förra gången var det svårt att genomföra en sådan studie, eftersom WordPress- och Joomla-sajter inte har sådana signaturer i URL:en. Kataloger som cmsmagazine.ru/catalogue/ ger inte en tillräcklig urvalsstorlek. Vad är 600 Drupal-sajter? Jag måste erkänna att resultaten av experimentet gjorde mig besviken. Av de 12 590 studerade platserna identifierades motorn framgångsrikt på endast 7 083, det vill säga endast i 56% av fallen. Jag kanske inte tog hänsyn till någon motor? Var det verkligen sant att hälften av forumen hade Bitrix installerat? Eller borde jag ha ägnat mer tid åt att söka efter signaturer? I allmänhet krävs ytterligare forskning här. Bland de 56 % av framgångsrikt identifierade motorer var de mest populära, som väntat, IPB (31 %), phpBB (26,6 %) och vBulletin (26,5 %) De följs med stor eftersläpning av SMF (5,8 %) och DLEForum (5,3 %). Min favorit punBB var bara på 6:e plats (1,64%). Jag skulle inte rekommendera att lita så mycket på dessa siffror (de säger att vart tredje forum på RuNet körs på IPB), men vissa slutsatser kan naturligtvis dras. Till exempel, om du tänker skapa en webbplats på en forummotor och planerar att modifiera forumet, låt oss säga, betala användarna $0,01 för varje meddelande med automatiskt uttag av pengar en gång i veckan, då bör du välja en av de tre mest populära motorerna. Ju mer populärt forumet är, desto större är chansen att hitta en programmerare som är väl insatt i det. Om inga betydande förändringar förväntas i motorn, kan det vara vettigt att välja en mindre populär motor, till exempel SMF eller punBB. Detta kommer att minska antalet hackerattacker på ditt forum och mängden spam som automatiskt skickas till det. Skript för att söka/identifiera forum kan också hitta många praktiska tillämpningar. Det första jag tänkte på var att sortera de identifierade forumen efter TIC och posta på de första hundra inläggen med länkar till en av mina sajter. Hundratals dofollow-länkar på forumet påverkade dock inte TCI på något sätt (2 uppdateringar har passerat), så det är bättre att inte slösa tid här, om du inte är intresserad av övergångar. Det är tydligt att den nämnda användningen av skript är långt ifrån den enda. Jag tror att du lätt kan komma på hur du annars kan använda dem. Arrangerat av Botmaster Labs, inte planerat. Jag har inte tid, videon behövs för en tävling, som en nymodig trend, även om allt kan förklaras lättare med bra skärmdumpar (min IMHO), och jag vill inte fotografera någonting. Det finns väldigt få lönsamma ämnen kvar, dum spam härskar inte alls längre, du måste tänka här och ingen kommer att skjuta ämnen, om du inte försöker lägga de föråldrade i en vacker omslag och pudra dem lite. :) Men det här handlar inte om oss. Generellt sett blev dessa 3 "gör inte", tror jag, i grunden hinder för deltagande i tävlingen för majoriteten av potentiella deltagare. Det är som att reparera en bil av tre: billig, hög kvalitet, snabb - tjänsten kan bara uppfylla två villkor samtidigt. sitta och välja det som är närmast dig. :) Det är samma sak med en tävling: jag har tid, jag vet hur man gör en video, men det finns inget ämne, eller jag vet hur man gör en video, det finns ett ämne, men jag har inte tid kl. allt, eller så har jag ledig tid och det finns ett litet ämne, men videon är skrämmande. Men detta är bra om 2 villkor är uppfyllda samtidigt. Nåväl, okej, låt oss slänga texten. Jag fortsätter för mig själv. Jag planerade inte, vilket betyder att jag deltog i tävlingen, jag valde till och med vilken artikel jag skulle rösta på. Vad du än säger kan Doz programvaran mycket väl och vet hur man använder den mycket intelligent. Men idag fick jag veta att det har dykt upp intriger i tävlingen. Det visar sig att jag inte kommer att kunna rösta, och bara nykomlingar som köpte programvaran 2011 kommer att kunna göra detta, och tävlingen är designad för dem. Jag blev lite förvånad, men ägaren är en gentleman. Tävlingen är en reklamkampanj och Alexander vet bättre hur den ska genomföras. Generellt bestämde jag mig då för att posta en artikel, det är något lättare att skriva när det är klart för vem, för hela kollektivbruket, faktiskt, det är omöjligt att göra detta. Drivs av php-Fusion I version Khroomer 7.07 tränas programmet på flera nya motorer: forumi.biz, forumb.biz, 1forum.biz, 7forum.biz, etc. phpBB-fr.com, Solaris phpBB-tema Och processen att lära sig nya saker är kontinuerlig. "Drift av SMF 1.1.2" "Drivs av SMF 1.1.3" "Drivs av SMF 1.1 RC2" "Drivs av SMF 1.1.4" "Drivs av SMF 1.1.8" "Drivs av SMF 1.1.7" "2006-2008, Simple Machines LLC" Och det är inte allt. När vi samlar in motorversioner hittar vi på vissa SMF-forum rubriken "2001-2006, Lewis Media" i sidfoten. Vi kontrollerar denna begäran, den uppfyller oss också fullt ut. Vi hittar en liknande begäran: "2001-2005, Lewis Media". När vi tittar igenom sidfotarna ytterligare hittar vi följande begäran: "SMFone design by A.M.A, ported to SMF 1.1". Vi kollar – jättebra. Och så vidare. En halvtimmes arbete och du har en underbar databas med frågor för motorn, och Google kommer att förbjuda dig för dessa frågor mycket mindre ofta än om du använder operatörer i dem. Och samtidigt blir din databas mycket renare än om du använder frågor som "index.php?topic=", för här kommer Google att ge inte bara de forum vi behöver, utan också många vänsterresurser där det var möjligt lämna en länk till forumets ämne. Du kanske invänder, vad är det för fel med det? Andra lämnade en länk, så vi kan också. Men! Länkar kan lämnas inte bara av Khrumer, utan också av andra program. Dessutom kan de skräddarsys speciellt för att lämna kommentarer på en viss resurs, så kallad högspecialiserad programvara, plus att sådana länkar kan lämnas för hand. Återigen, jag upprepar, det är inte mängden sopor som är viktig för oss, utan kvaliteten, vi kommer att samla in databasen med rätt förfrågningar. Fördelen med denna metod är att du praktiskt taget inte behöver konfigurera sil -filter
伟哥 - Viagra 吉他 - gitarr 其他 - vila 保险公司 - försäkring Lägg dessa ersättande koder i Words-filen: %E4%BC%9F%E5%93%A5 %E5%90%89%E4%BB%96 %E5%85%B6%E4%BB%96 %E4%BF%9D%E9%99%A9%E5%85%AC%E5%8F%B8 Om du marknadsför en försäkringswebbplats, genom att placera en länk i din profil på ett tematiskt (!) även kinesiskt forum som hittats på begäran " SMF-forum" 保险公司 det kommer att bli väldigt bra.
skriv ut "phpbb \n"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?phpbb\.com\/?"[^>]*>phpBB/i eller
# $data =~ /viewforum\.php\?[^""]*f=\d+/i eller
$data =~ /phpBB\-SEO/i eller
$data =~ /)
;
skriv ut "ipb \n"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?invision(?:board|power)\.com\/?[^"]*"[^>]*> [^<]*IP\.Board/i
eller
$data =~ /]+href="[^"]*http:\/\/(?:www\.)?invisionboard\.com\/?"[^>]*>Invision Power Board/i eller
$data =~ /
$data =~ /index\.php\?[^""]*showforum=\d+/i)
;
skriv ut "vbulletin \n"
if ($data =~ /Drivs av:?[^<]+vBulletin[^<]+(?:Version)?/i
eller
$data =~ /)
;
skriv ut "smf \n"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?simplemachines\.org\/?"[^>]*>Drift av SMF/i eller
$data =~ /index\.php\?[^""]*board=\d+\.0/i)
;
skriv ut "punbb \n"
if ($data =~ /]+href="[^"]*http:\/\/(?:(?:www\.)?punbb\.org|punbb\.informer\.com)\/?"[^>]*> PunBB/i); #eller
# $data =~ /viewforum\.php\?[^""]*id=\d+/i);
skriv ut "fluxbb \n"
# if($data =~ /viewtopic\.php\?id=\d+/i or
if ( $data =~ /]+href="http:\/\/(?:www\.)fluxbb\.org\/?"[^>]*>FluxBB/i)
;
skriv ut "exbb \n"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?exbb\.org\/?"[^>]*>ExBB/i); # eller
# $data =~ /forum\.php\?[^""]*forum=\d+/i);
tryck "yabb \n"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?yabbforum\.com\/?"[^>]*>YaBB/i eller
$data =~ /YaBB\.pl\?[^""]*num=\d+/i ) ;
skriv ut "dleforum \n"
if ($data =~ /\(Drift av DLE Forum\)<\/title>/i eller
$data =~ /]+href="[^"]+(?:http:\/\/(?:www\.)?dle\-files\.ru|act=copyright)[^"]*">DLE Forum<\/a>/i)
;
tryck "ikonboard \n"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?ikonboard\.com\/?[^"]*"[^>]*>Ikonboard/i eller
$data =~ /\n"
if ($data =~ /\n"
# if($data =~ /forum\.php\?fid=\d+/i or
# $data =~ /topic\.php\?fid=\d+/i or
if ($data =~ /]+href="http:\/\/(?:www\.)?flashbb\.net\/?"[^>]*>FlashBB/i)
;
tryck "stokesit \n"
# if($data =~ /forum\.php\?f=\d+/i or
if ($data =~ /]+href="http:\/\/(?:www\.)?stokesit\.com\.au\/?"[^>]*>[^\/]*Stokes IT/i)
;
tryck "podium \n"
# if($data =~ /topic\.php\?t=\d+/i or
if ($data =~ /]+href=[""]?http:\/\/(?:www\.)?sopebox\.com\/?[""]?[^>]*>Podium/i)
;
skriv ut "usebb \n"
# if($data =~ /forum\.php\?id=\d+/i or
if ($data =~ /]+href="http:\/\/(?:www\.)?usebb\.net\/?"[^>]*>AnvändBB/i)
;
skriv ut "wrforum \n"
# if($data =~ /index\.php\?fid=\d+/i or
if ($data =~ /]+href="http:\/\/(?:www\.)?wr\-script\.ru\/?"[^>]*>WR\-Forum/i)
;
skriv ut "yetanotherforumnet \n"
if ($data =~ /Yet Another Forum\.net/i or
$data =~ /default\.aspx\?g=posts&t=\d+/i)
;
site:talk.*.ru
site:board.*.ru
site:smf.*.ru
site:phpbb.*.ru
....
Den långa inledningen är över, nu till saken.
Vad behöver en nybörjare när han har köpt en sådan supertröska, som är Xrumer + Hrefer-komplexet? Det stämmer, lär dig hur du arbetar med det och kasta bort illusionen att du kan tjäna pengar genom att börja skriva skräppostark. Om du tror det är det bättre att donera dina pengar till välgörenhet direkt. Du måste lära dig hur du använder komplexets verktyg, helst vässa det själv. Tiden för "ta mer - kasta längre" är borta. Kvantitet ger vika för kvalitet. Det betyder att vi kommer att montera en bas åt oss själva; om du inte lär dig hur man gör detta kommer du att hamna bakom tåget. Naturligtvis kommer Khrefer att hjälpa oss med detta. Om du planerar att marknadsföra dina resurser på Google måste vi också söka efter givarwebbplatser via Google. Jag tycker att detta är förståeligt och logiskt. Men Google, liksom kopparbergets älskarinna, ger inte bort sin rikedom till alla. Du behöver ett förhållningssätt till det. Jag skulle genast vilja säga att hoppas inte att utifrån de tecken som du hittar i allmänheten kommer du att kunna samla ihop något. Anledningen till att de är tillgängliga offentligt är för att de är värdelösa. Jag kommer inte att utveckla ämnet ytterligare. Det är bättre att berätta hur du monterar det korrekt så att du kan se resultatet, du kan räkna ut resten själv, det viktigaste är att förstå principen. Vi måste samla in de rätta baserat på egenskaperna hos de specifika motorer vi behöver, och inte på egenskaperna hos forum i allmänhet. Detta är det största misstaget för nybörjare - att inte koncentrera sig på en specifik sak, utan att försöka täcka allt i sin helhet. Och även, om du vill analysera en mer eller mindre normal databas, sluta använda operatorer i frågor. Ingen "inurl:", "site:", "title" osv. Google kommer omedelbart att förbjuda användare som du. Därför studerar vi noggrant de motorer som Khrumer för närvarande arbetar med:
I allmänhet måste vi förbereda de korrekta frågorna för analys av Hrefer. Låt oss ta forumet dizhok som exempel. SMF-forum. Och låt oss börja demontera den till reservdelar för analys. Vår älskade Google hjälper oss med detta. Ange en fråga i Google SMF-forum- det är mycket skräp i sökresultaten, vi spolar tillbaka till någon 13:e sida och väljer valfri länk. Jag stötte på den här: http://www.volcanohost.com/forum/index.php?topic=11.0. Låt oss öppna den och studera den. Vi måste hitta något karakteristiskt på sidan som kan användas för att söka efter andra sidor på denna motor. I sidfoten lägger vi märke till följande inskription Drivs av SMF 1.1.14, citera det och skriv in det i Google, det visar oss att det för denna fråga känner till cirka 59 miljoner alternativ. Vi tittar snabbt igenom länkarna, lägger till ett par alternativ till detta sökord, till exempel, "Drift av SMF 1.1.14" poppel eller "Drivs av SMF 1.1.14" viagra. Vi ser till att förfrågan är stor, resultaten är bara forum och nästan inget skräp.
Dessutom är vi inte intresserade av kvantitet, utan av kvalitet, som jag sa ovan. Varsågod. Från samma forum tar vi en annan fras från sidfoten: , vi citerar det också och matar det till Google. Som svar avslöjar han att han känner till mer än 13 miljoner resultat. Återigen tittar vi snabbt igenom resultaten, lägger till ytterligare ord och kontrollerar resultaten med dem. Vi ser till att förfrågan är utmärkt och det finns dessutom nästan inget skräp. I allmänhet finns det redan 2 järnförfrågningar. Jag föreslår att du lämnar det första forumet ifred tills vidare och fortsätter att samla in förfrågningar från andra forum. Lyckligtvis har vi Google öppet på begäran. 2006-2008, Simple Machines LLC. Vi tar från sökresultaten, till exempel dessa forum: http://www.snowlinks.ru/forum/index.php?topic=1062.0 och http://litputnik.ru/forum/index.php?action=printpage ;topic=380.0 i sidfötterna tar vi följande frågor från dem: "Powered by SMF 1.1.7" och "Powered by SMF 1.1.10" (jag rekommenderar alltid att du skriver in frågor för Hrefer inom citattecken, eftersom vi behöver kvalitet först av Allt). Jag tror att det är klart vad vi gör, i slutändan kommer vi att ha en viss databas med frågor för att söka forum på SMF-motorn (den valdes som ett exempel, samma sak med andra motorer).
Det kommer att se ut ungefär så här:
Jag tror att det är mycket viktigt att lära sig hur man använder Hrumer korrekt i det inledande skedet, för när man väl lär sig detta kan man alltid hitta en användning för Hrumer, oavsett hur situationen förändras. Skydd blir mer komplicerat, och om skyddet har stärkts på vissa typer av motorer och Khrumer inte klarar av det för tillfället, så är det ingen idé att lägga resurser på att samla in dessa länkar och sedan arbeta med dem med Khroomer, är bättre att koncentrera krafterna på det som ger resultat. Och samtidigt, om Botmaster Labs-teamet lärde Khroomer något nytt, kan du snabbt dissekera en ny patient och förbereda basen för Khroomer medan patienten fortfarande är varm. Tid är pengar, resursen kanske inte längre är relevant när du köper basen. samlat in av någon. Dessutom utökar korrekt insamling av baser för dig själv den "vita" användningen av Khrumer avsevärt. Och det är precis där allt rör sig, vare sig vi gillar det eller inte, och processen med blekning eller gråning pågår. Svarta lakan håller på att bli ett minne blott på alla möjliga sätt.
Alla andra tekniska aspekter av att arbeta med Hrefer kan ses i hjälpen och det är ingen idé att uppehålla sig vid dem, alla mål, poäng, sekunder ställs in experimentellt för varje bil individuellt.
Som en bonus kommer jag att lägga upp här en mall för att analysera den kinesiska sökmotorn Baidu, häromdagen frågade de mig om det, så jag gjorde det slentrianmässigt, ursäkta ordleken. :)
Värdnamn=http://www.baidu.com
Fråga=s?wd=
LinksMask=
Totala sidor=100
Nästa sida=
Nästa sida2=
CaptchaURL=
CaptchaImage=
CaptchaField=
Jag försökte testa att analysera dem, det fanns inget förbud, Khrefer samlade in resurser snabbt, alla frågor för att analysera liknade Googles, men det fanns många kinesiska resurser, med hög PR, och dessutom fanns det många platser där ingen European hade någonsin satt sin fot. Det är bättre att analysera kinesiska frågor. Google translate hjälper till med detta, skriv in en lista med sökord på ryska och översätt den till kinesiska. Sanningen i " Ord"Referensord kan inte läggas till på kinesiska, de måste kodas om.
Istället för kinesiska:
Avslutningsvis skulle jag vilja säga att jag aldrig förstod folk som klagade på att khrefers tillagades dåligt eller dåligt; som svar på detta ville jag alltid säga att du bara inte vet hur man lagar dem. Ingen parser kan samla in resultat bättre än en referent, förfrågningarna måste bara vara korrekta. Hrefer är en bil: bra, rejäl, tillverkad på tyska, men den körs av en person och allt beror på hur bra den är körd, man kan inte tvinga bilen att köra både höger och vänster samtidigt.
Ett separat ämne är rengöring av databaser, jag gjorde det en gång för 3 år sedan för en tidigare tävling. För det mesta är allt fortfarande relevant där, men nu kan du vägra att kontrollera efter 200 OK, jag gillade verkligen inte den här processen, det var väldigt stora fel, en massa onödiga saker filtrerades bort. Nu kan detta göras nästan automatiskt under driften av Khrumer, även om denna process inte är en komplett analog av att kontrollera efter "200 OK". Hur som helst, till saken: för inte så länge sedan dök en underbar möjlighet upp i Khrumer - att råna information från resurser vid tidpunkten för att driva ett projekt. Det ser ut så här. Du anger en mall som kommer att bearbetas under drift, och informationen som samlas in från mallen kommer att matas in i filen xgrabbed.txt i mappen Loggar. Du kan använda den här funktionen till vad som helst, fantasin är enorm. Jag använder den här funktionen en gång i veckan för att ta bort länkar från min fungerande "utgångna" databas. Det är ingen hemlighet att forum dör ut varje dag för att rensa vår databas från sådana resurser, och verktyget "Autograbbing" kommer att hjälpa oss i det här fallet.
När allt kommer omkring måste du erkänna att när vi ofta skriver till exempel http://www.laptopace.com/index.php ser vi att den här domänen redan är till exempel en bra kille som säljer pengar, men det finns ingen forum där. Så för att kasta ut detta slagg från basen kommer vi att råna. :) Öppna sidans källkod och se denna post där:
Nu kommer alla "döda män" från goudaddi att bli kända för oss vid namn.
Här är ett litet urval för Autograbbing-verktyget, om du vill rensa databasen för olika "utgångna" domäner: