지난 9월 25일 Apache Lucene Java 가 2.9.0 로 릴리즈 되었습니다.
While we generally try and maintain full backwards compatibility between major versions, Lucene 2.9 has a variety of breaks that are spelled out in the 'Changes in backwards compatibility policy' section of CHANGES. We recommend that you recompile your application with Lucene 2.9 rather than attempting to “drop” it in. This will alert you to any issues you may have to fix if you are affected by one of the backward compatibility breaks.
릴리즈 뉴스에 따르면 많은 feature들과 성능을 위해 (CHANGES 를 보면 알 수 있듯이) 완벽한 하위호환성을 지킬 수 없었다고 합니다. 2.4.1에서 단번에 2.9.0으로 띄웠으니 그럴만도 하네요.
- Per segment searching and caching (can lead to much faster reopen among other things)
- Near real-time search capabilities added to IndexWriter
- New Query types
- Smarter, more scalable multi-term queries (wildcard, range, etc)
- A freshly optimized Collector/Scorer API
- Improved Unicode support and the addition of Collation contrib
- A new Attribute based TokenStream API
- A new QueryParser framework in contrib with a core QueryParser replacement impl included.
- Scoring is now optional when sorting by Field, or using a custom Collector, gaining sizable performance when scores are not required.
- New analyzers (PersianAnalyzer, ArabicAnalyzer, SmartChineseAnalyzer)
- New fast-vector-highlighter for large documents
- Lucene now includes high-performance handling of numeric fields. Such fields are indexed with a trie structure, enabling simple to use and much faster numeric range searching without having to externally pre-process numeric values into textual values.
CHANGES 내역을 보면 API 변경 38개, 버그 수정 26개, 새 기능 36개, 최적화 13개, 하위호환 정책 변경 7개, 런타임 동작 변경 15개 등으로 많고, 그 내용을 제가 전혀 해독할 수 없어서 옮기지 않았고요. 뉴스에 포함된 summary만 옮겨두었습니다.
Lucene 으로 서비스 운영하시던 분들은 작업해야할 것들이 많이 늘었겠네요.
고생하시길 바랍니다.
Continue Reading
Discover more thoughts and insights
치팅 컬처
"거짓과 편법을 부추기는 문화" 라는 멘트에 이끌린 책, 치팅 컬처를 읽게 되었다. 세상에는 수많은 치팅(Cheating)이 만연하고 있다는 것은 누구나 안다. 어려서 가족들로부터 깨끗한 윤리들이 많이 주입된
런던에 온지도 어언 일주일
지난주 금요일, 아무런 준비도 없이 쌈지돈만 챙겨들고 아내와 함께 런던에 도착하여, 어느덧 그 다음 일요일 밤이 되었다. 인터넷 느려터진 것 말고는 별다른 불만이 없다. 서점에 가면 한국에서는 책의 내용을
MBTI는 맥락에 따라 달라진다
MBTI는 검사 시점에 스스로를 어느 롤로 지정했느냐에 따라 다른 값이 나온다. 질문지에 나오는 타인과 내 관계의 생존주기에 따라 다른 답을 하게 된다. 정규직 회사 동료들이나 오랜 친구들처럼 긴 관계들을 대할