Frage an die Linux Spezialisten zu "wget"

    • Offizieller Beitrag

    Hallo an alle Linuxer. ;)


    Ich habe ein Problem mit dem Befehl wget man wget ist mir bekannt hilft mir aber nicht weiter.


    Es geht um folgendes. Ich mache mit wget eine Sicherung vom Forum:


    Code
    wget -m -X */test/ -X */logs/ -nv -o /var/log/dft-backup_gross.log -P /volume1/sicher/dft-backup/ --user=xxx --password=xxx ftp://digitalfototreff.de


    Das funktioniert eigentlich auch.


    Aber:


    Der Parameter -X sollte eigentlich die beiden Verzeichnisse /test und /logs, welche auf dem Server liegen und die ich für die Sicherung nicht benötige, NICHT herunterladen.


    Die Verzeichnisse werden aber DOCH heruntergeladen, es scheint als habe -X keine Auswirkung.


    Das komische ist außerdem: Mit den angegebenen Parametern sollten nur neue und geänderte Dateien herunter geladen werden, es werden aber auch Dateien gesichert (nur verhältnismäßig wenige), die mit Sicherheit nicht geändert oder neu erstellt wurden. Darunter auch alte Log-Files, weshalb ich diesen Ordner auch ausschließen möchte.
    Aber auch einige andere Dateien werden gesichert, die sich nicht geändert haben.


    Kann mir da jemand auf die Sprünge helfen, wie die Parameter richtig zu setzen sind?


    Das ganze läuft übrigens auf einer Synology NAS als Cronjob in einer Script Datei backup.sh.


    Gruß Patrick

  • Sieht eigentlich richtig aus. Ich hab wget selbst erst zwei-drei Mal benutzt, aber um komplett alles herunterzuladen. Das Einzige, was mir ins Auge fällt, ist das doppelte X ... warum?

    Code
    man wget

    sagt mir, das Ding erfordere eine kommaseperierte Liste ...


    Dahe würd ich's mal mit

    Code
    wget -X /Pfad1,/Pfad2

    probieren. Aber warum das mit dem Zeitstempel nicht klappt - keine Ahnung.

    • Offizieller Beitrag

    Danke.


    Das habe ich auch schon gelesen, allerdings auch Beispiele mit dem doppelten X gesehen.


    Ich werde das heute Abend nochmals probieren (habe von hier keinen ssh Zugriff auf die NAS)


    Ist eigentlich /pfad/ richtig oder /pfad ohne Slash am Ende? Und braucht es den * vorne dran, wenn das kein Unterverzeichnis ist?
    Die Struktur ist grob gesagt so:


    Code
    /
    /files
    /logs
    /test


    Die Ordner liegen also direkt im Hauptverzeichnis.

    • Offizieller Beitrag

    Danke.



    Vielleicht hat noch jemand eine Idee zu der Sache mit dem Zeitstempel.


    Das Script werde ich heute Abend abändern und dann testen, mal schauen ob es dann geht.


    Gruß Patrick

    • Offizieller Beitrag

    Hm.
    Ist mir aber ein Rätsel, warum das mit fast allen Dateien auch ohne diesen Parameter funktioniert.


    Beispiel: Ich habe gestern morgen gesichert, da waren 4 Bilder aus der Galerie dabei, angenommen, die hatten die Namen a, b, c und d.


    Heute morgen bei der nächsten Sicherung 4 weitere Bilder aus der Galerie mit e, f, g und h. Da wurden dann nur die neuen Bilder gesichert - a, b, c und d wurden nicht mehr gesichert. So soll es auch sein.


    Er sichert aber immer einige Bilder aus einem anderen Verzeichnis auf dem Server (da liegen eigene Bilder von mir), die schon seit 2012 auf dem Server liegen und eben bei jedem Backup mitgesichert werden. Ist doch irgendwie komisch, oder? Und so auch mit noch einigen anderen Dateien, unterschiedliche Verzeichnisse und Dateitypen.

  • Na, -N ist doch in -m enthalten ... -> m = r,N,l =) Aber warum es nicht immer geht ... *schulterzuck* hab ich zu wenig Erfahrung. Allein hätt ich noch ne Zeile wie man nur bestimmte Dateien mit einem enthaltenen Namenskürzel runterlädt ... das hab ich mal gebraucht um NDVI-Sat-Daten vom USGS-Server zu holen ...

  • Stimmt Ritter!
    Vielleicht liegt es an der Konvertierung der Links, da sich dabei die Zeitstempel ändert. Es gibt eine Option, die die Zeitstempel der Originaldateien vergleicht und nicht der Konvertierten; allerdings fällt sie mir im Moment nicht ein, aber vielleicht hilft es dir bei der Suche...

    • Offizieller Beitrag

    Mehrdad: das ist der Parameter -K. ;)


    Also an dieser Stelle Rückmeldung.


    Da das ausschließen der beiden Verzeichnisse nun tatsächlich funktioniert - danke nochmals an dieser Stelle - sind es nun am Schluß noch 7 Dateien, die immer gesichert werden.


    Jetzt mache ich den Test und lösche diese Dateien auf dem Server und ersetze sie durch die Dateien aus dem Backup. ;)


    Patrick