ArchiveBox

ArchiveBox

Self Самостоятелно хостван уеб архив с отворен код.Взема история на браузъра / отметки / Pocket / Pinboard / и т.н., запазва HTML, JS, PDF файлове, медии и др.
  • Безплатно
Тъй като съвременните уебсайтове са сложни и често разчитат на динамично съдържание, ArchiveBox архивира сайтовете в няколко различни формата, извън това, което публичните архивни услуги като Archive.org и Archive.is могат да спестят.ArchiveBox импортира списък с URL адреси от stdin, отдалечен URL адрес или файл, след което добавя страниците в локална папка с архив, използвайки wget, за да създаде HTML браузър, който може да се преглежда, youtube-dl за извличане на медии и пълен екземпляр на Chrome без глава без PDF,Снимка на екрана и DOM и още ... Използването на множество методи и доминиращия на пазара браузър за изпълнение на JS гарантира, че можем да запишем дори най-сложните, фини уебсайтове в поне няколко висококачествени, дългосрочни формати на данни.### Може да импортирате връзки от: - Pocket, Pinboard, Instapaper - RSS, XML, JSON или обикновени текстови списъци - История на браузъра или отметки (Chrome, Firefox, Safari, IE, Opera и други) - Shaarli, Delicious, RedditЗапазени публикации, Wallabag, Unmark.it и всеки друг текст с връзки в него!### Може да запишете тези неща за всеки сайт: - `favicon.ico` favicon на сайта -` example.com / page-name.html` клонирайте на сайта, с .html добавен, ако няма - изход.pdf` Печат на PDF с помощта на хром без глава - `screenshot.png` 1440x900 снимка на сайта, използващ хром без глава -` output.html` DOM Изхвърляне на HTML след рендеринг с помощта на хром без глава - `archive.org.txt` Връзка къмзапазен сайт на archive.org - `warc /` за html + gzipped warc файла.gz - `media /` всеки mp4, mp3, субтитри и метаданни, намерени с помощта на youtube-dl - `git /` клон на всяко хранилище за връзки github, bitbucket или gitlab - `index.html` &` index.json`HTML и JSON индексни файлове, съдържащи метаданни и подробности Архивирането е добавъчно, така че можете да планирате `. / Archive` да се изпълнява редовно и да изтегляте нови връзки в индекса.Цялото запазено съдържание е статично и индексирано с JSON файлове, така че живее вечно и е лесно анализирано, не изисква винаги работещ бекенд.

Категории

Алтернативи на ArchiveBox за GNOME

WebArchives

WebArchives

Зрител на уеб архиви, предлагащ възможността да разглеждате офлайн милиони статии от големи обществени проекти, като Wikipedia или Wikisource.Features: