
Viimeksi päivitetty

Wayback Machine on koneen suosituin osa Internet-arkiston verkkosivusto. Ensimmäisen kerran vuonna 2001 käyttöönotetun ilmaisen online-työkalun avulla voit palata "ajassa taaksepäin" nähdäksesi miltä maailmanlaajuiset verkkosivustot näyttivät ajankohdista. Wayback-koneessa on 562 miljardia kirjoittamishetkellä verkkosivuja, joihin lisätään paljon enemmän vuosittain.
Tässä on katsaus Wayback-koneeseen ja sen erityispiirteisiin.
Internet-arkiston esittely
Brewster Kahlen ja Bruce Gilliatin luoma Internet-arkisto on voittoa tavoittelematon järjestö, jonka tehtävänä on "yleinen pääsy kaikkeen tietoon". Alusta alkaen, organisaatio on tarjonnut ilmaisen julkisen pääsyn digitoituun materiaaliin, kuten verkkosivuihin, kirjoihin, äänitallenteisiin, mukaan lukien live-konsertit, videot, kuvat ja ohjelmistot ohjelmia.
Tähän mennessä kaikki Internet-arkiston keräämä vie yli 70 Petatavua palvelintilaa, mukaan lukien kaksi kopiota kaikesta. Organisaatio rahoitetaan lahjoituksilla, apurahoilla ja kirjan digitalisointipalveluiden palkoilla. Yksityisyyden vuoksi Internet-arkisto ei seuraa lukijoidensa IP-osoitteita ja käyttää HTTPS-protokollaa (suojattua protokollaa) kaikkialla.
Wayback Machine
Vain yksi osa Internet-arkistosta, Wayback Machine, on suunniteltu sieppaamaan muutettua tai poistettua verkkosivuston sisältöä. Lanseerauksen jälkeen siitä on tullut yksi suosituimmista ja tunnustetuimmista paikoista verkossa. Kahle ja Gilliat nimeivät sivuston kuvitteellisen aikamatkailulaitteen mukaan 1960-luvun animaatiosarjassa The Rocky and Bullwinkle Show.
Vaikka Internet-arkisto aloitti sivuston julkaisemisen vasta lokakuussa 2001, Wayback Machine aloitti välimuistissa olevien verkkosivujen arkistoinnin toukokuussa 1996. Vuoteen 2001 asti digitaaliset nauhat tallensivat tietoja, joihin pääsivät vain tietyt tutkijat. Kun kaikki julkaistiin yleisölle viisi vuotta myöhemmin (kuten pitkään suunniteltiin), siinä oli jo yli 10 miljardia arkistoitua sivua.
Varastointi ja kokoelmat
Nykyään sivusto säilyttää historialliset verkkotiedot Linux-solmujen klusterissa. Wayback Machine lataa kaikki julkisesti saatavilla olevat tiedot ja datatiedostot verkkosivuilta indeksointimekanisminsa kautta. Kaikkia verkkosivustolle lähetettyjä ei kuitenkaan sisälly tähän, koska jotakin sisältöä on rajoitettu tai se on tallennettu tietokantoihin, joihin ei ole pääsyä. Tämän vuoksi jotkut verkkosivustot indeksoidaan paremmin kuin toiset sen mukaan, miten kehittäjät loivat sivuston kerrallaan.
Huomaat myös, että uudempi arkisto on, sitä enemmän sisältöä on saatavana mille tahansa sivustolle. Uusi työkalu, jonka Internet-arkisto otti käyttöön vuonna 2005, on yksi syy siihen, että uudemmat tiedot ovat täydellisempiä. Archive-It.org auttaa poistamaan osittain välimuistissa olevien verkkosivustojen epäjohdonmukaisuudet antamalla laitosten ja sisällöntuottajien kerätä ja säilyttää digitaalisen sisällön kokoelmia.
Tietoja indeksoinnista
Verkkorobotit, joita joskus kutsutaan hämähäkiksi tai hämähäkkirobotiksi, ovat yhtä vanhoja kuin itse Internet. Nämä indeksointirobotit ovat Internet-robotteja, jotka selaavat verkkoa jatkuvasti indeksointitarkoituksiin, mikä tekee niistä tärkeän osan modernista hakukoneesta. Indeksoijat, joita Wayback Machine käyttää verkkosivustojen digitaalisten tilannekuvien luomiseen, ovat peräisin useista lähteistä, jotka ovat muuttuneet ajan myötä.
Kuten huomaat nopeasti, tilannevedosten ottotiheys vaihtelee suuresti verkkosivuston mukaan. Tyypillisesti mitä suurempi (ja ehkä suositumpi) verkkosivusto on, sitä enemmän indeksointia tapahtuu. Lisäksi paljon riippuu siitä, kuinka usein verkkosivustolla on sivumuutoksia. Pienimmätkin verkkosivustot indeksoidaan lopulta, ellei ole syytä siihen. Esimerkiksi salasanalla suojattuja sivustoja ei indeksoida, eikä myöskään verkkosivustoja, joiden sivustojen omistajat ovat pyytäneet niiden sisällyttämistä.
Wayback-koneen käyttäminen
Wayback Machine -sivustoa on helppo käyttää kenellekään. Etsi verkkosivuston historiallisia otoksia kirjoittamalla sen nimi sivuston hakukoneeseen. Hakutulossivulla hyperlinkit tarkoittavat päivämääriä ja aikoja, jolloin sivusto arkistoitiin. Napsauttamalla linkkiä näet sivuston "ajassa taaksepäin".
Seuraavissa esimerkeissä näet helmikuussa 2005 ja marraskuussa 2014 nauhoitetun Applen verkkosivuston etusivun ja CNN: n kotisivun maaliskuussa 2004 ja syyskuussa 2010.
Huomaa: Nämä indeksoinnit sisältävät myös linkkejä muille ilmoitettuina päivinä tallennettuihin sivuihin, ei vain kotisivuihin.


Lisätyökalut
Tutkijoille ja yleisölle suunnatulla Wayback-koneella on muutamia sisäänrakennettuja työkaluja, joita tavalliset käyttäjät saattavat kaipaamaan. Esimerkiksi ulkoasun perusteella hakutulossivut ovat helposti viittaavia. Kuten selitettiin, "Jos löydät arkistoidun sivun, johon haluat viitata Web-sivulla tai artikkelissa, voit kopioida URL-osoitteen. Voit jopa käyttää sumeaa URL-osoitteiden hakua ja päivämäärittelyä... mutta se on hieman edistyneempi. "
Wayback Machine antaa myös sivuston omistajille mahdollisuuden tallentaa "Tallenna sivu nyt" -ominaisuus tietyn sivun tallentamiseen. Ja silti, se ei ole täydellinen. Tällä hetkellä ominaisuus ei lisää sivuston URL-osoitetta tuleviin indeksointeihin. Lisäksi pyyntö ei tallenna enempää kuin yhtä sivua. Se on kuitenkin hyvä ensimmäinen askel arkistoida verkkosivustosi historiallinen tietue.

Sinun ei tarvitse käydä Wayback-koneessa joka kerta tehdäksesi uuden haun. Sen sijaan voit löytää sisältöä kirjoittamalla osoitteen selaimesi työkalupalkkiin. Käytä tätä muotoa kaikissa hauissa: http://web.archive.org/*/www.yoursite.com/*. Käytä esimerkiksi http://web.archive.org/*/www.groovypost.com/* löytää arkistoituja sivuja GroovyPost!
Mobiili- ja kehittäjätyökalut
Lopuksi, Wayback Machine ei sijaitse vain verkon kautta. Löydät Wayback Machine -sovelluksen iOS ja Android. Siellä on myös laajennuksia Chromelle, Safarille ja Firefoxille. Kehittäjät haluavat myös tarkistaa Internet Archive Wayback Machine -sovellusliittymät. Niiden avulla kehittäjien on helpompaa hakea tietoja Wayback-sieppaustiedoista.
Internet Archive Wayback Machine tukee useita erilaisia sovellusliittymiä. Tällöin kehittäjien on helpompaa hakea tietoja Wayback-sieppaustiedoista.
Suosikkisivustojesi "ajassa taaksepäin" siirtyminen on tärkein syy vierailla Wayback-koneella. Se on myös loistava työkalu kaikille, jotka tutkivat verkkosivujen historiaa kouluprojekteihin tai yrityskäyttöön. Mitä tahansa teetkin, käy Wayback Machine -palvelussa ja katso, mitä voit löytää muutamassa yksinkertaisessa vaiheessa.
Lisätietoja Internet-arkiston Archive-It-tilauspalvelusta on osoitteessa virallinen nettisivu ja aloita osallistuminen tänään!