Oracle千萬條記錄插入與查詢小結(jié) |
發(fā)布時間: 2012/8/10 17:41:06 |
最近做了個項目,實現(xiàn)對存在千萬條記錄的庫表進(jìn)行插入、查詢操作。原以為對數(shù)據(jù)庫的插入、查詢是件很容易的事,可不知當(dāng)數(shù)據(jù)達(dá)到百萬甚至千萬條級別的時候,這一切似乎變得相當(dāng)困難。幾經(jīng)折騰,總算完成了任務(wù)。 1、 避免使用Hibernate框架 Hibernate用起來雖然方便,但對于海量數(shù)據(jù)的操作顯得力不從心。 關(guān)于插入: 試過用Hibernate一次性進(jìn)行5萬條左右數(shù)據(jù)的插入,若ID使用sequence方式生成,Hibernate將分5萬次從數(shù)據(jù)庫取得5萬個sequence,構(gòu)造成相應(yīng)對象后,再分五萬次將數(shù)據(jù)保存到數(shù)據(jù)庫;宋沂昼姇r間。主要的時間不是花在插入上,而是花在5萬次從數(shù)據(jù)庫取sequence上,弄得我相當(dāng)郁悶。雖然后來把ID生成方式改成increase解決了問題,但還是對那十分鐘的等待心有余悸。 關(guān)于查詢: Hibernate對數(shù)據(jù)庫查詢的主要思想還是面向?qū)ο蟮,這將使許多我們不需要查詢的數(shù)據(jù)占用了大量的系統(tǒng)資源(包括數(shù)據(jù)庫資源和本地資源)。由于對Hibernate的偏愛,本著不拋棄、不放棄的作風(fēng),做了包括配SQL,改進(jìn)SQL等等的相當(dāng)多的嘗試,可都以失敗告終,不得不忍痛割愛了。 2、 寫查詢語句時,要把查詢的字段一一列出 查詢時不要使用類似select * from x_table的語句,要盡量使用select id,name from x_table,以避免查詢出不需要的數(shù)據(jù)浪費資源。對于海量數(shù)據(jù)而言,一個字段所占用的資源和查詢時間是相當(dāng)可觀的。 3、 減少不必要的查詢條件 當(dāng)我們在做查詢時,常常是前臺提交一個查詢表單到后臺,后臺解析這個表單,而后進(jìn)行查詢操作。在我們解析表單時,為了方便起見,常常喜歡將一些不需要查詢的條件用永真的條件來代替(如:select count(id) from x_table where name like ‘%’),其實這樣的SQL對資源的浪費是相當(dāng)可怕的。我試過對于同樣的近一千萬條記錄的查詢來說,使用select count(id) from x_table 進(jìn)行表查詢需要11秒,而使用select count(id) from x_table where name like ‘%’卻花了33秒。 4、 避免在查詢時使用表連接 在做海量數(shù)據(jù)查詢時,應(yīng)盡量避免表連接(特別是左、右連接),萬不得已要進(jìn)行表連接時,被連接的另一張表數(shù)據(jù)量一定不能太大,若連接的另一張表也是數(shù)萬條的話,那估計可以考慮重新設(shè)計庫表了,因為那需要等待的時間決不是正常用戶所能忍受的。 5、 嵌套查詢時,盡可能地在第一次select就把查詢范圍縮到最小 在有多個select嵌套查詢的時候,應(yīng)盡量在最內(nèi)層就把所要查詢的范圍縮到最小,能分頁的先分頁。很多時候,就是這樣簡單地把分頁放到內(nèi)層查詢里,對查詢效率來說能形成質(zhì)的變化。 就是這些了,希望對遇到類似問題的朋友們能有所幫助! 本文出自:億恩科技【1tcdy.com】 服務(wù)器租用/服務(wù)器托管中國五強!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |