Friday, May 29, 2009

ปัญหากับ public key ของ ETCH

หมู่นี้เจอปัญหานี้บ่อย ขอจดวิธีการจัดการไว้หน่อยเถอะ

=========== ต้นตอ aptitude update ==============

Hit http://ftp.debianclub.org etch Release
Err http://ftp.debianclub.org etch Release

Get:2 http://ftp.debianclub.org etch Release [67.8kB]
Ign http://ftp.debianclub.org etch Release
Ign http://ftp.debianclub.org etch/main Packages/DiffIndex
Ign http://ftp.debianclub.org etch/main Sources/DiffIndex
Hit http://ftp.debianclub.org etch/main Packages
Hit http://ftp.debianclub.org etch/main Sources
Get:3 http://security.debian.org etch/updates Release.gpg [1032B]
Hit http://security.debian.org etch/updates Release
Ign http://security.debian.org etch/updates/main Packages/DiffIndex
Ign http://security.debian.org etch/updates/main Sources/DiffIndex
Hit http://security.debian.org etch/updates/main Packages
Hit http://security.debian.org etch/updates/main Sources
Fetched 68.8kB in 2s (23.2kB/s)
Reading package lists... Done
W: GPG error: http://ftp.debianclub.org etch Release: The following signatures couldn't be verified because the public key is not available: NO_PUBKEY 9AA38DCD55BE302B
W: There is no public key available for the following key IDs:
9AA38DCD55BE302B
W: You may want to run apt-get update to correct these problems
==========================

เมื่อเจอดังนี้ก็ต้องไปหา public key มา

# gpg --keyserver wwwkeys.eu.pgp.net --recv-keys 9AA38DCD55BE302B
# gpg --armor --export 9AA38DCD55BE302B | apt-key add -
# aptitude update

เท่านี้ก็เรียบร้อย

Data integration Case Study


การใช้ Data Integration กับ หลาย ๆ ลักษณะงาน


ทางด้าน Traffic

At the Traffic Centre of the Flemish governement, they have an application called the Traffic Control Centre that they use to monitor the state of the road network in Flanders. Every minute data is entering the system from more then 570 locations on the highways. However, because of the high volume of data this represents a problem towards the analyses of traffic situations. For that reason, a decision was made to go for the creation of a data warehouse. This data warehouse puts data in a multi-dimensional data model to allow the combination of different types of data against common dimensions. For example, it becomes possible to look the speeds measurements on a certain point on a road together with the weather conditions in that region. Long term storage is also a part of the objective. Because a data warehouse is by definition a historical database, this part would be easy if not for the large data volumes involved in this case. The largest fact table of the Traffic Centre's data warehouse contains above 1 bilion rows for 13 months worth of historical data. Kettle is used in this project to handle the data acquisition on the Traffic Control Centre application, as wel as the update of the dimensions and fact tables in the data warehouse. Furthermore, detailed logging is used to check for errors in the jobs that are launched every 15 minutes. (96 times a day!) So far the project is running for almost a year without a problem.


การเงิน
Financial institutions have to deal more and more with increasing regulations and obligations. One of the new accounting rule-sets that are coming their way is called "Basel II". One interesting part of "Basel II" says that banks need to keep a certain standard reserve for bad loans. However, if the bank in question can prove that they have a better then average loans portofolio, they can lower the percentage of money that they have to keep in reserve. This is called the Internal Rating Based (IRB) calculation. So, instead of letting money sit idle in the reserve, this money can be used to generate new income from other banking operations. However, how do yo prove that your customers are better than average? Well, you can use a data warehouse to do this. The data warehouse needs to acquire information from different parts of the lending process, from the request for a loan, over the acceptance to the processing of the monthly payments. A lot of information is also uploaded in the warehouse about the customers info and the different kind of products he has. For example if a customer has a lot of savings, this would lower the risk of a bad loan. A data warehouse can then excell in the creation of reports that combine all this info, providing a relative easy solution to this complex problem. The use of a data warehouse is also encouraged in this case because the IRB system has to have historical data for the past 6 years in order to be valid.

การตลาด

This is one area where a business intelligence system can really make a difference. That is because a direct marketing manager can make a lot of use of a data warehouse to report on his customers. For example if he has a budget to send a mailing to his 1000 best customers, he needs to select these 1000 customers. To determine what his best customers are, the manager wants to use Recency, Frequency and Monetary value (RFM) as parameters. These parameters are determined in the data warehouse by first gathering all the sales data in a sales fact table. (sales per customer per product). Every month, the data warehouse looks at all the customers and looks in the sales fact table and determines

  • how long it's been since the customer ordered? (Recency)
  • how many times he ordered in the last year? (Frequency)
  • the total amount of products ordered in that year? (Monetary value)
Based on this new fact table containing the RFM data, the manager can then make a better choice of customers based on the marketing principles of RFM. In short RFM means: a customer that orders frequently and has ordered not long ago and for a lot of money is more likely to do so then others in the future.As a consequence, if you select the 1000 customers based on RFM, you are likely to get a better return on investment then by selecting 1000 random customers. Departing from the sales and RFM fact tables, you can segment your customers into types like 'new customer', 'very good customer', '...' that eases the selection even more.


มันมีประโยชน์อย่างนี้นี่เอง ...

Tuesday, May 26, 2009

Data warehouse - Chapter 1 - evolution of decision support system

วิวัฒนาการของระบบสนับสนุนการตัดสินใจ

"หากเรารู้ว่าเท คอนกรีต อย่างไร เจาะอย่างไร และรู้ว่าขันน๊อตอย่างไร เมื่อเราสร้างสะพาน เราสามารถสร้างได้โดยไม่ต้องคำนึงถึงรูปร่างหรือการใช้งานของสะพานที่เราจะสร้าง"

แน่นอนว่ารายละเอียดของข้อมูลเป็นสิ่งสำคัญของคลังข้อมูล แต่คลังข้อมูลจะต้องสร้างจากสถาปัตยกรรมอันเดียวที่มองจากภาพกว้างเป็นหลัก จากนั้นค่อยย่อยลงไปที่ละส่วน แต่รายละเอียดนั้นจะถูกมองอีกทีเมื่อมองจากภาพกว้างแล้ว

Data warehouse เกิดจากการรวมกันของข้อมูล application ที่เรียกว่า Operational data โดยอาจมีการ integrate มาจากหลายระบบ ซึ่งขบวนการดังกล่าวมีความซับซ้อนและเป็นงานที่กินเวลานาน

การพัฒนา Data warehouse มีความแตกต่างจากการพัฒนาระบบ application อย่างสิ้นเชิง การพัฒนา application นั้นพัฒนามาจากหลักการของ SDLC (Software Development Life Cycle) แต่ Data warehouse พัฒนาด้วยหลักการของ Spiral Development

ผู้ใช้งาน Data warehouse นั้นมีความต่างจากผู้ใช้งานในระบบทั่วไป เพราะขบวนการคิดของคนเหล่านี้จะมองจากการค้นหาก่อน ซึ่งไม่เหมือนกับการกำหนดความต้องการ requirement ขึ้นมาก่อน ประโยคนี้อธิบายความหมายของ user นี้ได้ดี "Give me what I say I want, and then I can tell you what i really want."

Monday, May 25, 2009

หนังสือเล่มต่อไป

http://www.tpabookcentre.com/catalog/images/products/smT0413.jpg
ชื่อผู้แต่ง: Mint ( A Society for the Study of Management and Information Technology) ประเทศญี่ปุ่น
ชื่อผู้แปล:ดร.สมชาย กิตติชัยกุลกิจ
ISBN: 9744431555
BARCODE: 9789744431554
ปี: 2005
พิมพ์ครั้งที่: 1
ขนาด: B5
จำนวนหน้า: 316

เนื้อหา ไม่เหมือนหนังสือทั่วไป เพราะไม่เน้นการอธิบายทฤษฎี (ที่ไม่ได้นำมาใช้งานจริง) แต่เป็นการเล่าเรื่องง่าย ๆ แต่ครอบคลุมความรู้และเทคนิคสำหรับใช้ในงานจริง รวมถึง
- ซอฟต์แวร์เอ็นจิเนียริง
- โมเดลในการพัฒนา
- การวิเคราะห์และการออกแบบ
- เทคนิคเชิงโครงสร้างและ Object Oriented
- สิ่งแวดล้อมในการเขียนโปรแกรม
- คุณภาพของซอฟต์แวร์
- กระบวนการและเทคนิคในการทดสอบ
- แนวโน้มของการพัฒนาซอฟต์แวร์


ที่อยากอ่านไม่มีอะไรมาก แค่ว่าญี่ปุ่น เท่านั้นเอง

Thursday, May 21, 2009

Data Warehouse บทที่ 0

หลังจากหาหนังสืออ้างอิงภาษาไทยอยู่นาน วันนี้ก็ซื้อหนังสือมาเล่มหนึ่งชื่อว่า "Building the Data Warehouse" และแน่นอนว่าหนาพอดู

จากการอ่านบทนำนั้นหนังสือเขียนไว้ว่า "Father of Data Warehouse is Inmon"

Tuesday, May 5, 2009

คุณจำผลลัพธ์ หรือ วิธีหาผลลัพธ์ กันแน่

ฉุกคิดได้ว่า เวลานึกอะไรที่ผ่านมาเนิ่นนานแล้ว ผมจะนึกการวิธีการเข้าไปหามัน แต่ไม่ใช่นึกว่ามันคืออะไร แล้วคุณหละ?

ผลดีของการคบกับผู้ใหญ่ไว้บ้าง

ผมนี่ก็คบกับผู้ที่อาวุโสมากกว่าหลายคน ส่งที่ผมพึ่งจะนึกได้ก็คือ สิ่งที่ได้จากการมีเพื่อนหรือที่ปรึกษาที่มีความอาวุโสมากกว่า นั้นคือ ประสบการณ์นั่นเอง

เพราะว่ามันหาไม่ได้ตามหนังสือหรือส่ืออ่ื่นๆ มันตอบโต้ไม่ได้ ดังนั้นสื่อนี้จึงถือว่าเป็นองค์ความรู้ที่มีประโยชน์