The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"подсобите с wget"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Открытые системы на рабочей станции (WEB, Браузеры / Linux)
Изначальное сообщение [ Отслеживать ]

"подсобите с wget"  +/
Сообщение от Felix (??) on 06-Ноя-11, 14:41 
Есть сайт мне нужны с него только определенные страницы
создаю запрос
$wget -nc -w 1 -r -l 100 -A htm,html http://site.ru/katalog={20..1120}
всё работает,но качает все страницы в указанном диапазоне,как бы wget объяснить что мне нужны только каждая 5 страница то есть в данном случае 20 25 30 итд вплоть до 1120?

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "подсобите с wget"  +/
Сообщение от Square (ok) on 06-Ноя-11, 18:13 
> Есть сайт мне нужны с него только определенные страницы
> создаю запрос
> $wget -nc -w 1 -r -l 100 -A htm,html http://site.ru/katalog={20..1120}
> всё работает,но качает все страницы в указанном диапазоне,как бы wget объяснить что
> мне нужны только каждая 5 страница то есть в данном случае
> 20 25 30 итд вплоть до 1120?

а запрашивайте каждуй страницу индивидуально, подставляя значения из шелл-переменной

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "подсобите с wget"  +/
Сообщение от Felix (??) on 06-Ноя-11, 19:22 

> а запрашивайте каждуй страницу индивидуально, подставляя значения из шелл-переменной

сделал так
#!/bin/bash
COUNTER=20
URL=' http://site.ru/katalog={$COUNTER}'
until [ $COUNTER -lt 1120 ];
do wget -nc -w 1  $URL  
echo $COUNTER
let $COUNTER+=20
done

попробовал так,но он сохраняет файлы с именем http://site.ru/katalog={$COUNTER}
башка не варит- воскресенье видимо


Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору

3. "подсобите с wget"  +/
Сообщение от Square (ok) on 06-Ноя-11, 22:00 
>[оверквотинг удален]
> #!/bin/bash
> COUNTER=20
> URL=' http://site.ru/katalog={$COUNTER}'
> until [ $COUNTER -lt 1120 ];
> do wget -nc -w 1  $URL
> echo $COUNTER
> let $COUNTER+=20
> done
> попробовал так,но он сохраняет файлы с именем http://site.ru/katalog={$COUNTER}
> башка не варит- воскресенье видимо

двойные кавычки

Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

4. "подсобите с wget"  +/
Сообщение от erera22 (ok) on 07-Ноя-11, 13:49 
curl
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

5. "подсобите с wget"  +/
Сообщение от Andrey Mitrofanov on 07-Ноя-11, 13:55 
> curl

В него калькулятор с кнопкой '+=5' встроен? Увау!!

Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

6. "подсобите с wget"  +/
Сообщение от XAnder (ok) on 07-Ноя-11, 18:24 
Изврат, конечно, но:

wget -nc -w 1 -r -l 100 -A htm,html \
`for i in {0..220}; do echo http://site.ru/katalog=$((20 + $i*5)); done`

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

7. "не, курл так не умеет"  +/
Сообщение от Andrey Mitrofanov on 07-Ноя-11, 18:45 
> Изврат, конечно, но:
>
wget -nc -w 1 -r -l 100 -A htm,html \ 
> `for i in {0..220}; do echo http://site.ru/katalog=$((20 + $i*5)); done`

$ printf 'http://ouph.net/?index%d.php\n' `seq 1 5 20`
http://ouph.net/?index1.php
http://ouph.net/?index6.php
http://ouph.net/?index11.php
http://ouph.net/?index16.php
$ _

...Brought to you by our sponsors at... info coreutils seq
---|xargs wget ...

Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору

8. "не, курл так не умеет"  +/
Сообщение от Andrey Mitrofanov on 07-Ноя-11, 18:48 
> $ printf 'http://ouph.net/?index%d.php\n' `seq 1 5 20`
> ---|xargs wget ...

%)
seq 1 5 20 |xargs printf 'http://ouph.net/?index%d.php\n' |xargs wget $WGET_OPTS

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

9. "не, курл так не умеет"  +/
Сообщение от XAnder (ok) on 08-Ноя-11, 08:49 
Ну точно, изврат был :-) Про seq-то я и забыл. Беда.
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру