Oracle 12.2新特性掌上手冊 - 第三卷 Core Improvements
編輯手記:Oracle 12.2 在內核上有許多創造性的改進,這些改進讓數據庫的操作更加高效便捷,同時一些麵向智能運維和大數據的改進,則邁出了雲和大數據時代的重要一步。在今年的DB-Engines的評選中,Oracle位居榜首,而我們從12.2的這些更新中便知道,Oracle是DBMS當之無愧的領導者。
注:文章內容來自官方文檔翻譯。若需要了解更多,請查閱官方文檔。
1、Partition-Specific Near Real-Time Indexes(近實時索引的配置)
12.2中可以在分區級別指定使用近實時索引的選項(STAGE_ITAB設置),頻繁更新的分區可以啟用接近實時的索引,而較少頻繁更新的表可以關閉它。
當使用STAGE_ITAB索引選項創建CONTEXT索引時,將創建一個空的$ G表,其中包含$ H btree索引。 將g_index_clause子句與STAGE_ITAB索引選項結合使用可改善廣泛用於DML操作的CONTEXT索引的SQL查詢的性能。
並且在12.2中可以指定近實時$ G索引表的最大大小,若調整最大大小,會將更新寫入主$ I表,指定最大大小可防止近實時$ G索引表過大而無法容納到內存中。
2、Partitioning: Auto-List Partitioning(自動列表分區)
數據庫會自動為表的每個不同分區鍵值創建一個單獨的(新)分區。自動列表分區減少了DBA管理分區的負擔,為需要單獨分區的大量不同鍵值手動維護分區表列表。 它還自動處理未計劃的分區鍵值,而不需要DEFAULT分區。
3、Adding New Document Formats(添加新的文檔格式)
在12.2版本中,Oracle Outside-In Technology支持的格式可以使用AUTO_FILTER編製索引,新添加的格式也可以索引。
4、Structured/Sort Data (SDATA) Section Improvements
對SDATA節進行了以下改進:
B樹支持的SDATA部分可進行範圍搜索,以獲得更好的性能。
SDATA可以針對SEARCH或SORT操作進行優化
多值SDATA節 - 組數在結果集接口中的SDATA節上可用。
這些SDATA改進在Oracle Text索引環境中提供更好的性能和更靈活的混合查詢。
5、Availability of Updated Documents in Index(更新文檔在索引中的可用性)
在早期版本中,當文檔更新時,在索引同步之前,無法搜索它們。
在12.2中,可以選擇保留舊的甚至過期的索引條目,以便仍然可以從其原始內容中找到文檔。
若對文檔做小的改動,不必立即執行索引同步,仍然可以進行索引。
6、Read-Only MDATA Sections(隻讀MDATA段)
普通的MDATA段可以在不需要重新索引整個文檔的情況下唄更新,但這樣做會產生性能成本。
在12.2中,可以選擇將MDATA段指定為read-only,這意味著它們隻能在文檔更新和索引同步時被更改。
此功能為查詢提供更好的性能,因為不需要額外的遊標來處理read-only MDATA段。 減少所需的光標數量也可以防止超過OPEN_CURSORS係統參數的限製。
7、 Sentiment Analysis and Collocates(情緒分析和搭配)
情緒分析?!
介個好像聽起來很神奇的樣子,是否很多人跟我一樣第一次聽說數據庫還能實現這功能,一種被打臉的感覺。
Oracle文本支持情感分析和搭配。 情緒分析提供與搜索詞相關聯的積極和消極趨勢的識別。與搜索術語相關聯的積極或消極趨勢的識別允許構建更豐富的搜索應用。
想了解更多的朋友看這裏:
Oracle文本能夠通過訓練以識別情感元數據的情感分類器來對主題或文檔執行情緒分析。
隨著數據量的增加,如果組織能夠獲得對其數據的更多洞察,而不僅僅是響應於搜索查詢獲得“命中”,這將會產生很大的價值。洞察可以是回答某些基本類型的查詢(例如天氣查詢或關於最近事件的查詢)或提供關於用戶指定的主題的意見的形式。關鍵字搜索提供包含搜索字詞的結果列表。但是,要識別關於搜索術語的情感或意見,則需要通過瀏覽所有結果,然後手動查找所需的情緒信息,進行進一步的數據分析。情緒分析提供一個一步過程來識別一組文檔內的情感信息。
情感分析是從一組文檔中識別和提取與指定主題或實體相關的情感元數據的過程。使用訓練的情緒分類器來識別情緒。當使用情緒分析運行查詢時,除了搜索結果之外,還標識和顯示情緒元數據。情緒分析提供諸如“產品評論是肯定的還是否定的”或“客戶滿意還是不滿意”的問題的答案。例如,從由針對特定產品的多個評論組成的文檔集中,可以確定指示產品是好還是壞的整體情緒。
8、 Extracting Synonyms of Words in Documents(提取文檔中單詞的同義詞)
CTX_DOC PL / SQL包中的TOKENS和POLICY_TOKENS函數現在允許指定同義詞庫名稱,執行該操作,返回的結果包括文檔中的實際詞以及由指定的詞庫定義的那些詞的所有同義詞。
此功能為數據分析和數據挖掘軟件提供了優勢,因為可以處理文檔中找到的單詞的所有變體。
9、Changes to NDATA, NEAR2, and NESTED NEAR Query Operators(對NDATA,NEAR2和NESTED NEAR查詢運算符的更改)
新的Oracle Text BESTMATCH查詢運算符可以找到文檔中的術語集合,即使這些術語不存在或以變體形式存在也是如此。
此功能可在未知精確查詢字詞時提高召回率。
10、Materialized Views: Refresh Statistics History(物化視圖:刷新統計曆史信息)
物化視圖刷新統計信息可以以不同的粒度進行收集,以提供用於分析和報告的曆史數據。
存儲曆史物化視圖刷新統計信息可以深入了解物化視圖生態係統(或單個特定物化視圖)是如何演進的, 這些數據為曆史分析和診斷提供了獨特的見解。
11、Process Management(進程管理)
此功能通過預先創建過程資源來提高連接時間和並行處理時間。 管理員可以控製預先創建多少進程,以便新連接不必等待。 相反,進程可以使用預創建的進程資源,從而減少連接和並行處理時間。
此功能可提高用戶連接的連接和故障轉移時間,以及後台進程的進程生成時間。
12、Partitioning: Read-Only Partitions(隻讀分區)
分區和子分區可以單獨設置為隻讀狀態,這樣將禁用這些隻讀分區和子分區上的DML操作,這是對現有隻讀表功能的擴展。
隻讀分區和子分區啟用對DML活動的精細控製,這增強了分區表的數據管理功能。
13、Partitioning: Multi-Column List Partitioning(多列列表分區)
列表分區功能已擴展為啟用多個分區鍵列。
使用多個列來定義列表分區表的分區標準,可使新類應用程序從分區中受益。
在Oracle12.2中,內核設計方麵有很多重要的創新性改進,這些改進使得Oracle數據庫的運維能夠更好地應對大數據分析和各種智能管理。
更多新特性請登錄官網學習。
文章轉自數據和雲公眾號,原文鏈接
最後更新:2017-07-18 11:03:07