1 repository
Tools for processing and rewriting HTML in chunks to minimize memory footprints.
Distinct from HTML Streaming: Focuses on the parsing/processing of streams rather than the server-side delivery of rendered content.
Explore 1 awesome GitHub repository matching web development · Incremental HTML Processing. Refine with filters or upvote what's useful.
parse5 este un parser și serializator HTML WHATWG pentru Node.js. Acesta transformă șirurile HTML într-un Document Object Model (DOM) și convertește acele structuri înapoi în șiruri HTML valide, respectând logica definită de standardul HTML Living Standard. Proiectul funcționează ca un procesor de flux (streaming) HTML, utilizând parsarea incrementală pentru a gestiona documente mari în fragmente. Include un tokenizer compatibil cu HTML5 care folosește o abordare bazată pe mașini de stare pentru a descompune inputul în token-uri, conform specificațiilor web oficiale. Setul de instrumente acoperă parsarea documentelor HTML, serializarea și rescrierea în timp real prin fluxuri. Aceste capabilități permit analiza programatică și extragerea de date din documente HTML, menținând în același timp consistența în diferite medii.
Processes large HTML documents in chunks to minimize memory usage during analysis and real-time rewriting.