Komercjalizacja Internetu
Oczywiste jest, że Internet będzie także wykorzystywany do robienia pieniądzy po zniesieniu zakazu prowadzenia w nim działalności komercyjnej. Przyniosło to pozytywne skutki - w sieci pojawiły się ciekawe usługi ze znakomitym zapleczem technicznym, które ułatwiły życie internautom (wyszukiwarka Google czy serwisy aukcyjne), zaś firmy zajmujące się bardziej tradycyjną działalnością mogły uruchomić katalogi swych produktów, zapewnić nową drogę wsparcia technicznego oraz ich sprzedaży.
Jednak zauważmy, że ilość ludzi próbujących zbić majątek na Internecie jest znacznie większa. Można by rzec: to przecież dobrze, w końcu dzięki aktywności rodzi się innowacyjność. Faktycznie, w ogólności tak jest, ale w przypadku sieci mamy do czynienia z ogromną liczbą działań, w których innowacyjności za grosz nie ma, natomiast jedynym celem jest zarobienie jak najwięcej. Przyczyna takiego stanu rzeczy to technologia, która czyni to zadanie śmiesznie łatwym.
Zaśmiecacze
Stronę zaśmiecającą (zaśmiecacza) scharakteryzowałbym w następujący sposób:
- Bazuje wyłącznie na materiałach ściągniętych z innych miejsc sieci.
- Nie jest w żaden sposób innowacyjna, gdyż cel jej istnienia jest zupełnie niezwiązany z ułatwieniem życia internautom (reklama, pozycjonowanie).
- Internet funkcjonowałby dalej bez żadnych szkód, gdyby taka strona z sieci zniknęła.
Zaśmiecacze utrudniają znajdowanie informacji w sieci. Pomimo coraz lepszych algorytmów wyszukiwarek, a nawet blokad stosowanych na stronach przeciwko takim witrynom, wielu z nim udaje się prześlizgnąć i skutecznie zasyfić listę wyników. Gdy chcę znaleźć coś w sieci, potrzebuję różnych materiałów, a nie dwudziestu kopii tego samego w zmienionej oprawie i innych reklamach.
Pierwszym rodzajem takich śmieciarzy są spam-blogi, importujące treści z innych blogów, nierzadko z pominięciem autora, źródła itd., co jest już ewidentnym naruszeniem praw autorskich. Na drugim miejscu umieściłbym 99% istniejących w sieci katalogów stron. Istnieją one wyłącznie, żeby wypozycjonować inne strony lub zbierać kokosy na reklamach, nie do końca legalnie.
Poniekąd do tej kategorii można podciągnąć także niektóre agregatory RSS i planety blogów importujące wpisy z całej sieci poświęcone jednej tematyce. One faktycznie mogą ułatwiać życie i surfowanie po blogach części internautów - sam korzystam z dwóch planet, zarówno czynnie, jak i biernie - ale nie można ich zaakceptować, jeśli są obładowane reklamami i na dodatek treści importowanych wpisów pojawiają się w wynikach wyszukiwarek. Prowadzi to do opisanego powyżej zjawiska, iż zamiast 20 różnych artykułów mamy 20 kopii tego samego.
Często bywa, że właścicielem kilkunastu takich stron jest jedna osoba, a nawet że jadą one na jednym skrypcie i tym samym serwerze. Pozwala to stworzyć przy odpowiednim podejściu samopozycjonujący się układ.
Pozycjonowanie
Mechanizmy sortowania list wyników w wyszukiwarkach są tak ułożone, by promować strony najlepsze. Wykorzystane są tu cechy ewolucji, a całość działa mniej więcej jak półautomatyczny algorytm genetyczny. W ten sposób internauci powinni najpierw trafiać do informacji dobrej jakości poznawanych po tym, że wiele osób się na nie powołuje.
Człowiek może poszukiwać w Internecie dwóch typów informacji (jest to pewne uproszczenie na potrzeby tego wpisu): produktu danego rodzaju lub wiadomości/wiedzy. Pozycjonowanie stron w większości przypadków utrudnia dostanie się do tego drugiego, gdyż na pierwszych miejscach przeważnie pojawią się odnośniki do stron producentów. Rzecz jak najbardziej praktyczna, gdy faktycznie szukamy części, ale zdecydowana większość ludzi nie musi codziennie kupować nowego procesora czy pamięci, za to o wiele częściej specjaliści mogą poszukiwać artykułów technicznych itp. Zwykłe odwoływanie się nawzajem do swoich tekstów nie zawsze ma dość mocy, by przebić amatorską stronkę przez wypozycjonowane serwisy (m.in. za pomocą stron-śmietników).
Pozycjonowanie ma jeszcze jedną, ciemną stronę. Przyczynia się do powstawania nowych stron-zaśmiecaczy: Tworzenie własnego zaplecza.
Licencjonowanie
Paradoksalnie, czasem młynem na wodę są zbyt liberalne zasady kopiowania naszych materiałów, przez co wytrącamy sobie z ręki ostateczną broń. Nie bez powodu kopiowanie treści wpisów na Zyxist.com jest zabronione bez mojej zgody, a na licencję Creative Commons wybrałem taką, która ma w treści Wyłącznie użycie niekomercyjne. Przez to, tak jako ciekawostka, de iure takie technorati importuje wpisy z Zyxist.com nielegalnie, gdyż ja się wcale nie prosiłem o dodawanie do tego agregatora :). Co prawda w polskim sądownictwie też często panuje zasada "prawo swoje, pieniądz swoje", jednak jest to droga ostateczna. Zazwyczaj wystarczy po prostu e-mail, by materiały zniknęły z miejsca, gdzie nie chcemy, by się znajdowały. Tak przy okazji zastanawiam się, jakie byłyby wyniki eksperymentu, gdyby przebadać agregatory blogów pod kątem legalności publikowanych tam wpisów. Bo to, że nie wszystkie blogi znalazły tam się za wiedzą autora (co formalnie jest wymogiem regulaminu), jest więcej, niż oczywiste.
Podsumowanie
Z jednej strony ciężko bronić ludziom prawa do zarabiania pieniędzy, jednak z drugiej trochę to zobowiązuje. Nie sądzę jednak, by większość ludzi się opamiętała w imię dowolnego wyższego celu, gdy w grę wchodzi kasa. O czego są jednak działania defensywne, jak filtry RSS, edukowanie i zwyczajne ignorowanie takich stron przy wszelkiej nadarzającej się okazji...






Napisał Kłeczek Marcin w piątek, 30 maja 2008 o 10:22
Nikt nie powiedział, że w RSSach powinien znaleźć się cały artykuł - a wielu blogerów tak robi. Wystarczy pierwszy akapit (jak u Ciebie) i już wiem, czy "Otwórz stronę w nowym oknie" czy "CTRL+ +" i patrzymy dalej kto co napisał. Wrzucanie agregatorów (czy nawet planet) do 1 wora z spamblogami jest co najmniej krzywdzące. Agregatory są dobre - nawet jeśli wyświetlają reklamy przy twoich wpisach - bo 1. linkują do twojej strony, 2. ludzie, którzy nie wiedzą o twoim istnieniu czytają twoje artykuły, 3. ułatwiają znalezienie powiązanych artykułów, 4. pozwalają na używanie kilkudziesięciu/setek RSSów i "nie gubienie" się w tym. Większym problemem są "content-steal"ery - które kradną całą treść (bez względu na to, czy masz RSSy czy nie) i do tego strukturę! Napisałem "antybota", który w kilka prostych sposobów blokował "automaty" - obejść można go było prosto, ale trzeba było kilku "standardowych metod", którymi kierują się zwykłe spidery (msn/yahoo/googlebot) - rel="nofollow" omijać, odczekiwać kilka sekund pomiędzy wywołaniami, ukryte linki (człowiek nie kliknie, "automat" i owszem) itd itp. - kilkanaście blokad dziennie! A strona o baaaardzo małej oglądalności - taki mój poligon doświadczalny... przejrzyj swoje logi - sam zobaczysz :)