Archive.org est la bibliothèque d’Internet. Dans cet article, nous allons vous en dire un peu plus sur elle et vous montrer comment en tirer le meilleur parti pour de nombreuses tâches.
Qu’est-ce qu’Archive.org et à quoi sert-il ?
Cette bibliothèque internet à but non lucratif a une vocation bien claire : préserver le contenu d’internet et le rendre accessible à tous. Elle défend également la libre circulation de l’information en proposant cette bibliothèque ouverte et en facilitant l’accès universel au savoir.
Comment fonctionne Internet Archive ?
Il est évident que, pour maintenir cette bibliothèque à jour, il est nécessaire d’y ajouter continuellement du nouveau contenu. Cela peut se faire de différentes manières, comme nous allons le voir.
L’une des options consiste à utiliser des robots d’indexation (crawlers). Ces bots sont chargés de parcourir le web à la recherche de nouveaux contenus à intégrer à la bibliothèque numérique. Une fois cette information trouvée et stockée, elle est consultable sans problème grâce à un outil connu sous le nom de Wayback Machine.
Une autre option permet à des particuliers — comme vous et moi — de déposer leur propre contenu dans cette bibliothèque gratuitement. Exemples de contenus que vous pouvez y déposer : blogs, podcasts, vidéos, documents… bref, tout type de contenu que vous souhaiteriez voir perdurer. Si vous tenez à ce que votre travail survive au fil des années et ne disparaisse jamais, téléverser vos informations dans cette bibliothèque est probablement le moyen le plus fiable d’assurer la pérennité de votre contenu en ligne. Dans bien des cas, même si l’on parvient à supprimer du contenu d’Internet, il peut toujours se retrouver ici.
Enfin, il existe des bénévoles qui se consacrent à téléverser des informations dans la bibliothèque. Ces utilisateurs numérisent toutes sortes de livres et de documents textuels pour enrichir le fonds de la bibliothèque.
Entretenir cette bibliothèque a un coût. Stocker toutes ces informations nécessite des serveurs — non seulement de nouveaux serveurs à ajouter au fur et à mesure des nouveaux contenus, mais aussi la maintenance de ceux déjà en place pour que l’information reste accessible à tous. L’Internet Archive se finance essentiellement de plusieurs façons. L’une des plus courantes est le versement de dons par de grandes entreprises. Des sociétés comme Google ou la Smithsonian Institution font régulièrement des dons à la bibliothèque pour l’aider à couvrir ses dépenses.
Par ailleurs, la bibliothèque bénéficie également de la fortune personnelle de son fondateur, Brewster Kahle. Brewster a fait fortune en vendant Alexa Internet à Amazon et le protocole WAIS à AOL, et il investit cet argent dans cette bibliothèque en ligne. Enfin, grâce à des partenariats — des accords noués avec des tiers qui contribuent au financement de la bibliothèque elle-même.
Comment rechercher des fichiers sur Archive.org ?
Pour accéder à tous les fichiers disponibles sur Archive.org, rendez-vous sur https://archive.org/index.php.
Une fois sur la page, vous disposez d’un moteur de recherche qui, à l’instar de Google, vous permet d’effectuer n’importe quelle recherche au sein des archives. Vous pouvez affiner votre recherche par type de fichier — texte, radio, télévision, etc. — en tapant simplement ce que vous souhaitez trouver. Si le contenu est stocké, vous le verrez. Lorsque vous accédez à un fichier en particulier, vous avez la possibilité de l’écouter ou de le visionner.
Depuis cette page, vous pouvez également téléverser votre propre contenu dans la bibliothèque ou effectuer un don. Tout est clairement expliqué et parfaitement intuitif, afin que vous puissiez y participer si vous le souhaitez.
Que peut encore faire cet outil pour nous ?
Préserver Archive.org est fondamental pour que la culture d’internet reste libre et perdure au fil des années. Selon son créateur, Brewster Kahle, le contenu sur internet disparaît ou est modifié en moyenne tous les 100 jours.
Ces modifications font que le contenu se perd progressivement avec le temps et que son passage sur le web peut être éphémère. Grâce à Archive.org, tout le contenu peut être préservé et ainsi perdurer dans le temps, sans dépendre de serveurs tiers ni de modifications constantes.
Tous ceux qui souhaitent consulter ce contenu le trouveront là. Avoir accès à une bibliothèque de cette envergure, et gratuitement, c’est presque avoir accès à l’ensemble du savoir mondial. Cet outil revêt une importance bien plus grande qu’il n’y paraît, car il promeut la liberté et la culture d’internet pour tous.
Enfin, Archive.org collabore avec des sites comme Wikipedia ou Alexa afin que, dans le cas où ces derniers auraient un lien brisé, ils puissent accéder à la version du contenu stockée dans cet Internet Archive.
Si du contenu vous concernant ou concernant votre marque a été indexé par Archive.org et nuit à votre réputation en ligne, contactez-nous. Nous sommes spécialistes en gestion de la réputation en ligne et en suppression de contenus.