The text from this page can be cleanly downloaded to your terminal directly using the following command: curl -s https://harfordcda.neocities.org/darkweb.html | sed 's/<[^>]*>//g ; /^$/d'| tr -s '\n' '\n' | sed -r /^r?$/d #################################### ##############Onion Site Scraping############## #################################### Use wget to get a big scraping of current onion sites: wget -U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' https://jncyepk6zbnosf4p.onion.ly/onions.html > onions.html cat onions.html| grep -oP '.{16}\.onion' > dark.txt #################################### Topic #################################### #################################### Topic ####################################