⚈ Kuopassa.net

Lisää kertomuksia netistä. 摆烂

Tagipilvi

"htaccess"

Koska Kuopassa.net-blogissa on niin paljon sisältöä, jo 1365 julkaistua kirjoitusta, katsoin parhaaksi ryhtyä hyödyntämään Textpatterniin (siis siihen systeemin, jolla näitä blogikirjoituksia ko. sivustolla julkaistaan), luotua tagipluginia. Tuo tagiplugini mahdollistaa yksittäisten blogikirjoitusten merkitsemisen tietyillä avainsanoilla. Suosituimmat avainsanat ryhmitellään tagipilveen. Tällä sivulla listataan kaikki tagilla, siis avainsanalla htaccess, merkityt blogikirjoitukset.

JSON Feed

It’s about this thing. JSON Feed is like an upgrade to the idea of RSS and Atom and maybe even to Google’s AMP. Now Textpattern has a plugin that generates a JSON Feed of recently published articles. Currently the plugin that I put together, that is kuo_json_feed, offers articles with HTML and not with plain text. It seems that Textpattern saves each article to database in two formats: with Textile and with HTML. So it’s not easy to create a plain text version of articles as it’d require either stripping HTML or Textile tags.

Lue kokonaan…

Tipsejä kuinka globaaleja asetuksia voi tehdä CodeIgniterilla

Otsikko on valmiina tälle blogijutskalle, samoin tagit. Pieni meta descriptionkin on kirjoitettu (vaikka se ei vielä taida näkyä julkisesti). Sitten pitäisi kai ruveta nakuttamaan itse sisältöä. On muutama asia, jotka haluan mainita CodeIgniterista, kuten sen, että tuon… ääh… nyt joudun käyttämään hipsterisanaa — frameworkin — kanssa samassa kansiossa config.php-tiedoston kanssa on constants.php-niminen asetustiedosto. Sinne voi laittaa sivuston laajuisia asetuksia, kuten sivuston nimen.

Lue kokonaan…

Kuvahaussa näkyminen on vaikeaa huonoilla kuvien tiedostonimillä

Julkaisujärjestelmä Textpatternissa huonot kuvatiedostojen tiedostonimet eivät ole katoamassa mihinkään. Kuvatiedostot saavat tiedostonimikseen Textpatternissa vain numeroita huolimatta siitä, että kuvan uploadaamisen yhteydessä tietokantaan tallennetaan kuvan alkuperäisen tiedostonimen lisäksi mahdollisesti myös kuvan kategoria, sekä alt- ja title-teksti. Sen vuoksi vaikkapa kuvablogin voi olla hankalaa saada kävijöitä Googlen kuvahausta. Jos tiedostonimet sisältäisivät pari tai kolmekin kuvaan liittyvää avainsanaa, näkisimme kuvahaun tuloksissa enemmän TXP-vetoisia webbisivuja. Toistaiseksi helpoimmalta vaikuttava keino avainsanoittaa kuvien tiedostonimiä on laittaa sivuston .htaccess-tiedostoon esimerkiksi rivi RewriteRule ^kissakuvat/kissa-([^/]+)$ ./images/$1, jossa ajatellaan, että kuva sijaitsee oikeasti osoitteessa images/1.jpg mutta sen voi avata (myös) osoitteesta kissakuvat/kissa-1.jpg. Tuo on tietysti kaukana parhaasta mahdollisesta ratkaisusta, mutta on parempi kuin ei mitään.

Lue kokonaan…

Kaivon myrkyttäminen, tai siis kuinka tarjota sisällön skreippaajalle paljon ei-mitään

Textpatternin foorumilla mainittiin tapaus, jossa jokin aasialainen taho oli imuroinut kokonaisen nettisivuston sisältöineen ja kaikkine ulkoasun grafiikkoineen ja JS-tiedostoineen. Sivuston alkuperäistä omistajaa eniten harmittaa kuinka tekstimuotoinen sisältö päätyi vääriin käsiin. Kloonattu sivusto toimii edelleen netissä. Se tarjoaa täsmälleen saman sisällön kuin alkuperäinenkin, ainoastaan domainosoite on siinä eri. Foorumilla luin hauskan idean kuinka tuollaista perusteellista skreippausta voi torjua. Idean isä kutsuu sitä Kaivon myrkytys -menetelmäksi. Siinä hän tunnisti skreippaajan käyttämät IP-osoitteet ja tarjosi varta vasten niille omien sanojensa mukaan valtavat määrät hölynpölysisältöä. Sellaisen sisällön voi tehdä koneellisesti esimerkiksi niin, että PHP-tiedosto esittää jokaisella sivun latauskerralla X verran satunnaisia kirjaimia ja numeroita, ja niistä muodostuneen sotkun sekaan laitetaan linkkejä, ja vaikka lihavoituja, kursivoituja kohtia, tekstikappaleita, otsikoita ym. Se johtaa tilanteeseen, jossa koko sivuston skreippaamiseen pyrkivä taho seuratessaan linkkejä lataa uusia satunnaisia hölynpölysivuja, joissa on uusia seurattavia linkkejä hölynpölysivuille jne. Kierre jatkuu kunnes hölynpölyä rouskuttava tai sitä tuottava taho tukehtuu. Tätä ideaa voi tehostaa tekemällä vaikka sivustokartan ja luomalla sinne ”siemenperunaksi” jonkin verran linkkejä (jotka johtavat edellä mainittuun hölynpölygeneraattoriin).

Lue kokonaan…

Anna mun kaikki kestää

Metallifoorumin ääkköset olivat kilahtaneet kaikessa hiljaisuudessa. Vietin edelliset 1,5 tuntia etsiessäni korjausta siihen. HTML-lähdekoodissa merkistökoodauksen vaihtaminen ei tuottanut tulosta, joten kokeilin muita vaihtoehtoja ja löysin .htaccess-tiedoston sisälle lisättävän rivin, jolla vika vaikuttaa kaikonneen.

Lue kokonaan…

Affiliate-linkin piilottaminen

Mainoslinkkien pitäminen esillä blogissa tai millä tahansa nettisivulla arvatenkin jakaa mielipiteitä. Onneksi mielipiteet eivät ole kiinnostavia, joten en kirjoita niistä, vaan siitä kuinka mainoslinkin voi mahdollisimman pienellä vaivannäöllä piilottaa. Piilottaminen ei ehkä ole paras termi sille. Ehkä sitä voisi kutsua osoitteiden siistimiseksi. Affiliate-linkkejä voi siistiä useilla eri tavoilla. Niistä vaivattomimpia ovat PHP:n ja .htaccess-toiminnon avulla toteuttavat kikat.

Lue kokonaan…

Webhotelli.fi ei käytä gzip-pakkausta

Sain varmistuksen tuohon otsikon väitteeseen kesäkuussa, kun kysyin miksi gzip-pakkaus ei suostu pelaamaan vaikka olin sitä yrittänyt asettaa .htaccess- ja php.ini-tiedostoihin ja suoraan PHP-koodiin tehtyjen muutosten avulla. En saanut selville miksi gzip ei ole heillä käytössä, mutta kai sille jokin selitys löytyy. Yksi sellainen saattaa olla palvelimen resurssien vieminen. Palvelin käsittääkseni joutuu prosessoimaan enemmän dataa kun nettisivu tai muu gzip-pakattu resurssi yritetään lähettää pyytäjälle.

Lue kokonaan…

Puhtaat URL:it yhdellä rivillä

Ehkä tässä on harhaanjohtava otsikko. Ehkä ei. Avaamalla nettisivuston .htaccess-tiedoston ja lisäämällä siihen tämän blogimerkinnän lopussa sijaitsevan tempun, voi nettisivujen osoiterakenteen muuttaminen "puhtaaksi" olla mahdollista. Usein manuaalisesti luoduilla nettisivuilla ei ole järkevää lähteä luomaan konkreettisesti alihakemistoja, joilla voi laittaa osoiterakenteen näyttämään selkeältä. Tarkoitan siis, ettei laajoilla nettisivuilla kannata luoda uutta kansiota esimerkiksi Suomen sodat -nimistä sivua varten ja sen jälkeen asettaa kansion sisälle index-tiedosto, johon varsinainen sivun sisältö luodaan. Tässä hämärässä esimerkissä tuo yksittäinen sivu löytyisi esimerkiksi osoitteesta www.suomensodat.info/suomi-sodassa, jossa kauttaviivan jälkeinen osa on se manuaalisesti luotu kansio. Tällainen vaatii turhaa klikkailua ja vie aikaa.

Lue kokonaan…