grep адресов из списка

cat urls.html | grep -Eo "(http|https)://[a-zA-Z0-9./?=_%:-]*" | sort -u

  • grep -E : is the same as egrep
  • grep -o : only outputs what has been grepped
  • (http|https) : is an either / or
  • a-z : is all lower case
  • A-Z : is all upper case
  • . : is dot
  • / : is the slash
  • ? : is ?
  • = : is equal sign
  • _ : is underscore
  • % : is percentage sign
  • : : is colon
  • - : is dash
  • *: is repeat the […] group
  • sort -u : will sort & remove any duplicates

 

grep -Eo “(http|https)://[a-zA-Z0-9./?=_%:-]*\.(png|gif|jpg|jpeg)”

греп всех картинок

Firefox: кириллица в адресной строке

Если ссылка содержит not-ascii символы, то при копировании в буфер обмена (Chrome, FF) она превращается в килобайт нечитаемых символов
Как отключить URL-кодирование адресной строки при копировании в буфер обмена?

Рецепт

1. В адресной строке браузера прописываем: about:config (согласимся, что ничего не сломаем)

2. Находим в поиске строчку: network.standard-url.escape-utf8

3. Меняем значение true на false (двойным нажатием левой клавишей мыши по значению true)

Scroll to top