(PHP 5, PHP 7, PHP 8)
DOMDocument::loadHTMLFile — Load HTML from a file
The function parses the HTML document in the file named
filename
. Unlike loading XML, HTML does not have
to be well-formed to load.
Um modernes HTML zu parsen und zu verarbeiten, sollte Dom\HTMLDocument anstelle von DOMDocument verwendet werden.
Diese Funktion analysiert die Eingabe mit einem HTML 4-Parser. HTML 5, das von modernen Webbrowsern verwendet wird, hat andere Parsing-Regeln. Je nach Eingabe kann dies zu einer anderen DOM-Struktur führen, weshalb diese Funktion nicht bedenkenlos zur Bereinigung von HTML verwendet werden kann.
Das Verhalten beim Analysieren von HTML kann von der verwendeten Version von
libxml
abhängen, insbesondere in Bezug auf die
Randbedingungen und die Fehlerbehandlung.
Für Analysen, die der HTML5-Spezifikation entsprechen, sollte eine der in
PHP 8.4 eingeführten Methoden
Dom\HTMLDocument::createFromString() oder
Dom\HTMLDocument::createFromFile() verwendet werden.
Beispielsweise schließen einige HTML-Elemente implizit ein übergeordnetes Element, wenn sie darauf treffen. Die Regeln für das automatische Schließen übergeordneter Elemente unterscheiden sich zwischen HTML 4 und HTML 5, sodass die resultierende DOM-Struktur, die DOMDocument sieht, sich von der DOM-Struktur unterscheiden kann, die ein Webbrowser sieht.
filename
The path to the HTML file.
options
Bitweises OR
von libxml-Konstanten für weitere Optionen.
If an empty string is passed as the filename
or an empty file is named, a warning will be generated. This warning
is not generated by libxml and cannot be handled using libxml's error handling
functions.
Auch wenn fehlerhaftes HTML erfolgreich laden sollte, kann diese Funktion dennoch Fehler der Stufe E_WARNING
generieren, wenn sie auf falsches Markup stößt. Die Fehlerbehandlungsfunktionen von libxml können genutzt werden, um diese Fehler zu behandeln.
Version | Beschreibung |
---|---|
8.3.0 | This function now has a tentative bool return type. |
8.0.0 |
Calling this function statically will
now throw an Error.
Previously, an E_DEPRECATED was raised.
|
Beispiel #1 Creating a Document
<?php
$doc = new DOMDocument();
$doc->loadHTMLFile("filename.html");
echo $doc->saveHTML();
?>