12
ArchiveBox
Self Самостоятелно хостван уеб архив с отворен код.Взема история на браузъра / отметки / Pocket / Pinboard / и т.н., запазва HTML, JS, PDF файлове, медии и др.
- Безплатно
Тъй като съвременните уебсайтове са сложни и често разчитат на динамично съдържание, ArchiveBox архивира сайтовете в няколко различни формата, извън това, което публичните архивни услуги като Archive.org и Archive.is могат да спестят.ArchiveBox импортира списък с URL адреси от stdin, отдалечен URL адрес или файл, след което добавя страниците в локална папка с архив, използвайки wget, за да създаде HTML браузър, който може да се преглежда, youtube-dl за извличане на медии и пълен екземпляр на Chrome без глава без PDF,Снимка на екрана и DOM и още ... Използването на множество методи и доминиращия на пазара браузър за изпълнение на JS гарантира, че можем да запишем дори най-сложните, фини уебсайтове в поне няколко висококачествени, дългосрочни формати на данни.### Може да импортирате връзки от: - Pocket, Pinboard, Instapaper - RSS, XML, JSON или обикновени текстови списъци - История на браузъра или отметки (Chrome, Firefox, Safari, IE, Opera и други) - Shaarli, Delicious, RedditЗапазени публикации, Wallabag, Unmark.it и всеки друг текст с връзки в него!### Може да запишете тези неща за всеки сайт: - `favicon.ico` favicon на сайта -` example.com / page-name.html` клонирайте на сайта, с .html добавен, ако няма - изход.pdf` Печат на PDF с помощта на хром без глава - `screenshot.png` 1440x900 снимка на сайта, използващ хром без глава -` output.html` DOM Изхвърляне на HTML след рендеринг с помощта на хром без глава - `archive.org.txt` Връзка къмзапазен сайт на archive.org - `warc /` за html + gzipped warc файла.gz - `media /` всеки mp4, mp3, субтитри и метаданни, намерени с помощта на youtube-dl - `git /` клон на всяко хранилище за връзки github, bitbucket или gitlab - `index.html` &` index.json`HTML и JSON индексни файлове, съдържащи метаданни и подробности Архивирането е добавъчно, така че можете да планирате `. / Archive` да се изпълнява редовно и да изтегляте нови връзки в индекса.Цялото запазено съдържание е статично и индексирано с JSON файлове, така че живее вечно и е лесно анализирано, не изисква винаги работещ бекенд.