Kırmızı Şapka

Salesforce Blog

Yeni bir baglantim sayesinde biraz daha bilgilenmeye basladim. Bu blogu okumak/takip etmek gerek. Herseyi basite indirgemeyi biliyorlar. Ozellikle tanitim videolari cok vurucu.

Etiketler: Tools

private void parseHTML(ProcessedDocument htmlDoc, InputSource inputSource)
throws HTMLDocumentParserException {
// NekoHTML parser
DOMParser parser = new DOMParser();

// Create filter to remove elements that we don't care about.
ElementRemover remover = new ElementRemover();
// keep only a subset of elements (text and links)
remover.acceptElement("html", null);
remover.acceptElement("meta", new String[] { "name", "content" });
remover.acceptElement("title", null);
remover.acceptElement("body", null);
remover.acceptElement("base", new String[] { "href" });
remover.acceptElement("b", null);
remover.acceptElement("i", null);
remover.acceptElement("u", null);
remover.acceptElement("p", null);
remover.acceptElement("br", null);
remover.acceptElement("a", new String[] { "href", "rel" });
// completely remove these elements
remover.removeElement("script");
remover.removeElement("style");

StringWriter sw = new StringWriter();
XMLDocumentFilter writer = new HTMLWriter(sw, "UTF-8");

XMLDocumentFilter[] filters = { remover, writer };
try {
parser.setProperty("http://cyberneko.org/html/properties/filters", filters);
} catch (SAXException e) {
throw new HTMLDocumentParserException("Property is not supported", e);
}

try {
parser.parse(inputSource);
} catch (SAXException e) {
throw new HTMLDocumentParserException("Parsing error: ", e);
} catch (IOException e) {
throw new HTMLDocumentParserException("Parsing error: ", e);
}

}

Etiketler: Java

PGObject

Denemek icin not aliyorum. Enteresan isler bunlar.

http://dbaspot.com/forums/postgresql/362027-pg-8-3-rc1-uuid-column-jdbc-preparedstatement-column-type.html

Etiketler: PostgreSQL

Jython, komut satiri giris parametreleri, modul ekleme

PySystemState pySystemState = new PySystemState();
pySystemState.path.append(Py.newString("python/"));

//Burada python dizini altindaki moduller sisteme tanimli hale geitiriliyor
pySystemState.argv.append(Py.newString(pathToInFile+urlId));

//Dikkat argv[0] bos o nedenle argv[1] den basla
Py.setSystemState(pySystemState);
PythonInterpreter python = new PythonInterpreter();

ByteArrayOutputStream outStream = new ByteArrayOutputStream();
python.setOut(outStream);
python.execfile("python/Expedia.py");
String text = outStream.toString();

Etiketler: Java, Jython, Python

nohup ve disown

$ gv report.pdf &
[1] 9916
$ jobs
[1] + running gv report.pdf
$ disown %1
$ jobs
$ exit
# Shell exits, leaving gv running

nohup ise programi baslatirken kullanici oturumundan bagimsiz process yaratmak icin.

free ile RAM boyutunu gorebilirim.

Etiketler: bash

crontab -e

SHELL=/bin/bash
HOME=/home/vu/MAIN/
*/15 * * * * /home/vu/MAIN/report.sh

report.sh

#!/bin/bash

LIST="Renaissance Aloft Courtyard Sheraton Holiday Hilton Hyatt Westin"

REPORT=REPORTS/REPORT.dat

echo "VVVVVVVVVVV" >> $REPORT
date >> $REPORT

rm reviewLinks.txt ; cat links.txt | grep /ShowUserReviews- >>reviewLinks.txt
rm reviewLinks-uniq.txt; sed -e 's/#CHECK_RATES_CONT//' -e 's/#REVIEWS//' reviewLinks.txt |sort | uniq >> reviewLinks-uniq.txt
rm links-uniq.txt; sed -e 's/#.*$//' links.txt | sort |uniq >>links-uniq.txt
rm geoCodes.txt; sed -n 's/.*-$g[0-9]*$-.*/\1/p' links.txt | sort | uniq >> geoCodes.txt
rm reviewGeoCodes.txt; sed -n 's/.*-$g[0-9]*$-.*/\1/p' reviewLinks.txt | sort | uniq >> reviewGeoCodes.txt
echo "-----------" >> $REPORT
wc -l links.txt >> $REPORT
wc -l links-uniq.txt >> $REPORT
wc -l geoCodes.txt >> $REPORT
wc -l reviewLinks.txt >> $REPORT
wc -l reviewLinks-uniq.txt>> $REPORT
wc -l reviewGeoCodes.txt >> $REPORT
echo "-----------" >> $REPORT

for HOTEL in $LIST
do
FILE="REPORTS/${HOTEL}Reviews.txt"
rm $FILE; grep $HOTEL reviewLinks-uniq.txt >> $FILE
#echo $HOTEL
wc -l $FILE >> $REPORT
done

Etiketler: Tools

Eclipse plugin for MAven

Bunu kurduktan sonra eclipse de new->project->maven->checkout maven project from SCM diyorsun. Karsina bir pencere cikacak orada SCM icin svn sev sonra da projenin adresini gir. Bitti.

Etiketler: Tools

FreeMind

Super bir dusunce tahtasi programi.

Etiketler: Tools

Kırmızı Şapka

Pazartesi, Aralık 21, 2009

Salesforce Blog

Cuma, Aralık 18, 2009

Neko parser

PGObject

Perşembe, Aralık 17, 2009

Jython, komut satiri giris parametreleri, modul ekleme

Perşembe, Kasım 12, 2009

nohup ve disown

Çarşamba, Kasım 11, 2009

crontab -e

Salı, Kasım 03, 2009

Eclipse plugin for MAven

Salı, Ekim 27, 2009

FreeMind

Öneriler

Önceki Yayınlananlar

Sandıktakiler

EnderUNIX İpucu