LJSear.ch - un serviciu pentru cei care au nevoie de fișierele „Live Journal“
Servicii Web / / December 24, 2019
Doriți să găsiți în „Learn“ recordul vechi de un secol, dar nu se poate, pentru că opțiunile de căutare sunt limitate la o lună? Vei elibera servicii LJSear.ch, Care conține arhivele ruso-limba LiveJournal pentru perioada 2000-2015. Vorbeste despre ea creatorul său Roman Ivanov (kukutz).
Roman Ivanov
Product Manager în "Yandex". A lansat o căutare pe blog, personalizate de căutare „Yandex“, mai multe versiuni ale „Yandex. "servicii" Mail Yandex. Lenta "" Ya.ru "" Yandex. Imagini „si multe altele. Acesta este acum implicat în „Yandex. Browser „și LJSear.ch.
Ce este LJSear.ch?
„Learn“ Acest lucru este mai mult decât o arhive terabyte. Indexată și disponibile pentru căutarea 340 de milioane de posturi și comentarii 1 miliard de la 2000 până în toamna anului 2015. Și toate acestea cu familiar în blog instrumente de căutare: Limita de autor, după dată, de către comunitate.
Noile intrări nu sunt indexate, așa cum considerăm proiectul nostru ca o arhivă, memorial.
Proiectul este în întregime non-profit, nici o publicitate, precum și alte modalități de a face bani nu este destinat.
De ce am nevoie de serviciu?
În toamna anului 2015 capacitatea de căutare pentru blog-uri „Yandex“ au fost limitate la doar luna trecută. Explicația era simplă: marea majoritate a oamenilor sunt în căutarea informațiiAsociat cu înregistrări recente, și căutarea profundă pentru ei este redundantă.
Este adevărat. Luna trecuta este suficient pentru sarcini, cum ar fi monitorizarea regulată sau o căutare vanitate recenzii ale unor evenimente recente. Dar există o problemă și de cercetare mai profundă.
Eu cred că în „Learn“ sa întâmplat, sau cel puțin a fost reflectat aproape toate cultura vorbitoare de limba rusă zero de ani. Valoarea acestei arhive nu poate fi supraestimată. Când „Yandex“ are căutare arhiva închisă, eu sunt foarte dezamăgit, deoarece convins că această colecție de informații trebuie să fie păstrate pentru omenire. Ei bine, și am întrebat, „Yandex“ arhive, și a fost de acord dintr-o dată și le-a dat.
Arhivă blog destul de unic, pentru că atât de mult, nu poate fi descărcat în „Learn“. Multe reviste sunt eliminate de către autorii lor, unele rupte și distruse de către hackeri, în unele cazuri, înregistrările nu sunt șterse, dar ascunse sub cheie.
În ultimele șase luni am fost pe responsabilitatea de a asigura că datele nu se pierde. Am sunat pe ajutorul prietenilor, și printre ei au fost cei care au fost de acord pentru a înțelege dacă putem face informațiile disponibile pentru căutare. Am creat un LJSear.ch serviciu și se pare că l-au condus la o stare sănătoasă.
Voluntarii au fost mulți?
Au fost găsite. Un expert de renume în domeniul UX Kohl Zayarny Am venit cu design. Sasha Belyanskiy Am luat-vorstku BEM și frontend pe Node.js. Spaceinvaderz implicat administrarea sistemică. programare backend în PHP am început pe baza prototipului în sine, ceea ce a făcut prietenul meu Tobe.
Cea mai mare problemă a fost fierul de călcat: cine va plăti pentru găzduirea? Prieteni a dat asigurări că puteți colecta bani pentru site-urile kraudfandingovyh, dar am fost sceptic. Și sunt oameni minunați au venit la noi de la Servers.ru și a oferit ajutor. Ca rezultat, avem un server dedicat mare cu SSD pentru a indexa și de căutare backend, plus nor server virtual la frontend.
Cine ar putea fi interesat de proiect?
Ca înregistrări noi nu sunt indexate, publicul, care socotesc - sunt cercetători. Cum literalmente cercetatorii straturi culturale de la zero ani, și un curent sau foști utilizatori „Learn“, care doresc să găsească ceva care a fost scris în acei ani. Și pentru că nu am limita maximă de timp de execuție de căutări: Investigatorul poate aștepta pentru interogări complexe și minut, și două. Desigur, interogări simple sunt executate rapid, iar în cazul în care serviciul detectează că interogarea este acum o mulțime, acesta include o degradare controlată, inclusiv limite de timeout cerere.
LJSear.ch →